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本 书 介绍 了 有 关 回 归 分 析 、 重 回归 分 析 以 及 Logistic 回 归 分 析 的 实用 统计 学 知识 。 
回归 分 析 和 重 回归 分 析 可 以 解决 很 多 实际 生活 中 的 问题 ， 例 如 : 
@ 通过 “最 高 气温 ”来 预测 “ 冰 红 茶 的 销售 量 ”。 
@ 通过 “店铺 面积 ”和 “距离 最 近 车 站 的 距离 ”来 预测 “新 分 店 备 选 店铺 的 月 营 
业 额 ”， 并 进行 数值 预测 。 
Logistic 回 归 分 析 可 以 解决 的 问题 例如 : 
@ 通过 “吸烟 量 ”和 “饮酒 量 ”来 预测 “癌症 的 患 病 率 ”的 概率 分 析 。 
本 书 的 使 用 对 象 包括 ; 
O 阅读 完 《 漫 画 统计 学 》 或 者 具备 同等 程度 以 上 统计 学 知识 的 读者 。 
O 需要 进行 “数值 预测 ”和 “概率 预测 ”的 读者 。 
本 书 由 以 下 4 章 组 成 ， 
@ 第 1 章 基础 知识 
@ 第 2 章 回归 分 析 
@ 第 3 章 重 回归 分 析 
© 第 4 章 Logistic 回 归 分 析 
各 章 又 包括 : 
© 漫画 部 分 
© 对 漫画 部 分 进行 补充 的 文字 说 明 
第 1 章 所 讲 的 内 容 ， 是 学 习 第 2 章 及 以 后 内 容 时 所 必 备 的 基础 知识 ， 像 微分 、 矩 阵 
等 等 ， 可 能 是 大 多 数 读者 在 高 中 的 学 习 过 程 中 就 已 经 学 过 的 内 容 。“ 如 果 第 1 章 的 内 容 
都 没 办 法 理解 ， 还 怎么 阅读 第 2 章 以 后 的 内 容 啊 ”一 一 读者 大 可 不 必 心 存 这 种 不 安 。 在 
阅读 的 过 程 中 ， 您 会 逐渐 地 体会 到 “原来 对 数 就 是 这 个 意思 啊 ! ”“ 微 分 就 是 这 样 的 
运算 啊 ， 没 错 、 没 错 ， 我 想起 来 了 ! ”不 过 ， 对 于 那些 “完全 忘记 了 ， 看 了 也 想 不 起 
来 ”、“ 因 为 我 是 文科 生 ， 几 乎 没 学 过 ”的 读者 来 说 ， 如 果 不 花 些 功夫 去 理解 第 1 章 的 
内 容 ， 就 想 读 懂 本 书 的 主体 ， 也 就 是 第 2 章 以 后 的 内 容 ， 可 能 会 十 分 辛苦 。 
本 书 中 的 计算 过 程 记录 得 相当 详细 ， 数 学 基础 好 的 读者 只 需 仔细 地 看 一 遍 即 可 。 








数学 基础 稍 差 的 读者 ， 则 要 用 心 揣摩 、 多 加 思考 。 即 便 是 那些 觉得 意思 不 太 明 白 、 计 
算 起 来 也 困难 的 读者 ， 也 请 按照 书 中 的 步骤 把 解 求 出 来 ， 这 样 做 起 码 可 以 掌握 大 致 的 
计算 流程 。 读 者 没 必要 强迫 自己 一 次 就 理解 ， 要 耐心 地 坚持 读 到 最 后 。 不 过 在 阅读 过 
程 中 ， 请 您 一 定 要 全 神 贯 注 。 

在 阅读 中 ， 如 果 存在 读者 自己 的 计算 结果 和 书 中 的 计算 结果 不 一 致 的 情况 ， 这 
可 能 是 对 数据 进行 四 售 五 人 的 原因 。 如 果 因 此 给 读者 带 来 不 便 ， 还 请 各 位 读者 多 多 该 
解 。 

能 够 有 这 次 执笔 的 机 会 ， 我 要 感谢 株式 会 社 欧姆 社 开发 局 的 诸位 。 感谢 将 我 的 原 
稿 制 成 漫画 的 株式 会 社 TREND-PRO 的 诸位 。 感谢 负责 脚本 创作 的 re_akino 先 生 ， 以 及 
负责 绘画 的 Inoue Iroha 先 生 。 另 外 ， 立 教 大 学 社会 学 系 的 酒 折 文 武 先生 为 之 前 的 作品 提 
出 了 诸多 宝贵 建议 ， 在 此 深 表 谢意 。 
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还 是 在 学 习 吗 ? 
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Y 刚才 我 们 用 “最 高 气温 


这 一 个 因素 ， 来 预测 


冰 红 茶 的 销售 量 。 


RD 4 









比方 说 ， 在 诺 伦 我 们 将 每 天 的 “最 高 气温 ” 
和 “ 冰 红 茶 的 销售 量 ” 都 记录 下 来 。 






今天 的 最 高 气 
温 是 27C。/ 人 











如 果 做 “回归 分 析 ”， 我 们 就 可 
以 通过 最 高 气温 来 预测 冰 红 茶 的 





dikal 根据 一 个 因素 进行 预测 称 为 “回归 分 析 "， 
DOA 根据 多 个 因素 进行 预测 称 为 “ 重 回归 分 析 "。 
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B| AAA | AAA | AAA 
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我 来 给 你 举 个 例子 吧 。 某 个 
连锁 店 的 经 理 一 定 会 掌握 现 


有 店铺 的 情况 : 


* 与 竞争 对 手 的 距离 
* 方 加 500 米 以 内 的 住宅 数 


"宣传 党 
等 等 ， 类 似 的 数据 对 吧 ?了 










与 并 多 对 于 | 广 留 m0 六 
的 距离 (Knee) BR 













如 果 使 用 重 回归 分 析 的 话 ， 
就 能 够 通过 


“与 竞争 对 手 的 距离 
CÈ S00 米 以 内 的 住宅 数 
t 


= 


来 预测 “营业 额 ”了 。 


那么 在 考虑 开设 新 的 
店铺 时 


此 外 ， 还 有 叫做 “Logistic 
回归 分 析 ” 的 。 
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pei 首先 ， 我 们 来 学 习 
不 过 如 果 我 们 马上 上 > 数学 中 的 书写 规则 。 








这 个 是 “规则 "， 所 以 
不 用 问 为 什么 ， 只 要 
按照 它 做 就 可 以 了 。 


SL ee se at Beet Mav] 























RTR, BU-KHK 
Y=2xt+1 为 例 ， 
讲解 一 下 反 函 数 。 


如 此 说 来 可 以 把 x 看 成 fe 
“EA, VAR "MA" f: 
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试 着 变 成 我 们 常见 的 
坐标 方向 。 





这 样 的 话 ，x 轴 方向 
不 就 左右 相反 了 吗 ? 
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& 3. 指数 函数 与 自然 对 数 函数 w 



















好 1! 






来 讲 下 一 课 。 类 似 这 样 的 
函数 或 称 为 “指数 函数 "。 


它 叫 “自然 对 数 的 底 "， 也 叫 
in K’, 




















Aaw, ANH y= er 的 
Khkxr=e 称 为 “自然 
对 数 函 数 "。 



















但 是 , 由 于 “x = en 的 形式 不 易 理解 ， 
PUR AM AC x = ep HR “y=log, x" 
或 “y=logx” 的 形式 。 













指数 函数 与 对 数 函 
数 有 很 多 性 质 ， 










现在 我 开始 讲 哈 ， 
你 要 记 好 哦 | 
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| PRA 。 (e)“ 和 e” 是 等 价 的 。 L 


为 了 便于 理解 这 条 性 质 ， 我 们 以 {2-5 为 例 ， 来 具体 





WH, (eF 和 e 是 等 价 的 。 











ERD Sto REM, e > 


为 了 便于 理解 这 条 性 质 ， 我 们 以 上 23 为 例 ， 来 具体 说 明 ， 





后 和 ex" 是 等 价 的 。 


让 我 们 一 起 算 算 吧 ! 


exexe 和 


eexexexexe exexgxgxp è` 
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在 第 20 页 ， 我 们 曾 讲 过 ,y=logx 与 x=e" 是 同一 个 意思 。 这 就 是 说 ， 如 果 设 
loge) WL, HA, L=log(e’), KAW L=log(e’) 与 e=e: 等 价 ， 我 们 就 可 以 把 e=e' 改 


写成 下 面 的 形式 ， 


e=e! 
3=L 
由 于 ZL=log(e)， 所 以 等 式 3=log(e) 成 立 。 


(i MERA loga’) 和 bx(loga) 是 等 价 的 ! ass 











为 了 便于 理解 这 条 性 质 ， 我 们 以 {2 为 例 ， 来 具体 说 明 ，log(3) 和 5x logs 是 
等 价 的 。 





设 L=log3， 而 L=log3 与 3=e: 是 等 价 的 。 我 们 就 可 以 把 3=e: 改写 成 如 下 形式 。 


3=e! 
3'-(e05 PRA BH 
s-e ARE 
3s=esxL 

log(3*)=log(es**) 


log(3*)=5 x L -合计 EE 
HF L=log3, 所 以 等 式 log(35)=5 x (log3) 成 立 。 











a SC 
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= es — 


EP, logaHogb 和 log(aXb) 是 等 价 的 | = 


=3 
为 了 便于 理解 这 条 性 质 ,我 们 以 {5-5 为 例 ,来 具体 说 明 ， 
log3+log5 与 log(3x5) 是 等 价 的 。 

















L=log3 L=log3 
ie M=log5 » W { M=log5 sf 
N=log(3x5) N=log(3x5) 
我 们 可 以 把 ex eM=3 x 5 改写 成 
i ex eM =e Xi KEKE Xs xe=ex...xe=e"=3x5 
Ga peat ——— 


3x5=e% 


Y i. a 
所 以 etxew=3x5=ev 成 立 。 
由 于 L+M=N， 


所 以 log3+log5=log(3x5) 成 立 。 | 


性 质 1 (ey Al e Sth 
性 质 2 | -号 和 ce 等 价 
性 质 3 | a Ñl logie) 等 价 。 











性 质 4 log(e*) 和 bx (loga) 等 价 。 





性 质 5 logatlogb 和 log(ax b) 等 价 。 
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we | 接 下 来 我们 W 
PIRA | 


Z l 


没关系 ， 不 就 是 计算 只 | 
只 要 用 心 去 做 ， 就 不 会 那 





么 难 啦 | 
我 给 你 好 好 讲 讲 ， 你 要 加 
wir! | 










美光 的 “年 龄 ”和 “身高 ” 


年 龄 ( 少 ) | FH (BH) 


这 是 美 洞 从 进入 幼儿 园 开 始 








4 /00.1 到 现在 的 身高 数据 。 
5 107.2 
6 114.1 
7 121.7 
è 126.3 
9 130.9 
10 137.5 
vr 143.2 
(2 149.4 
13 ($1.6 
1% 154.0 
15 [54.6 
16 1540 
uy (S51 
(3 156.3 
9 158.7 





那么 ， 把 这 个 表 
对 应 的 图 形 画 出 
















(RA) ale 
E898888 





N 
S 






> 


25 





















那么 ， 让 我 们 来 看 看 6 岁 美 忆 长 个 啦 ! 
和 7 岁 时 的 美 羽 吧 ! 





热 后 ， 再 回 到 刚才 的 问题 ， 
我 们 先 抛 开 细 节 ， 大 致 地 
讲 一 下 ， 美 羽 从 4 岁 到 19 


画 出 图 像 后 ， 
应 该 是 这 样 | 
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就 是 通过 “回归 分 析 ” 被 我 的 话 弄 糊 涂 了 吧 ? 关 
求解 出 来 的 “回归 方 于 “回归 方程 ”， 我 们 以 
a 


你 看 ， 我 们 是 不 是 可 这 样 的 话 ，" 从 6 岁 到 (6+1) 岁 这 1 年 间 所 长 高 的 身高 " 
以 把 “7 岁 ” 改 写成 用 刚才 的 式 子 
“(6+1) 岁 " 啊 ? 


就 可 以 大 致 
计算 出 来 。 





如 此 说 来 ， "从 6 岁 到 (6+1) 
岁 这 1 年 间 ， 身 高 的 年 平均 
增长 率 ” 就 应 该 是 这 样 。 


那 再 想 一 起 ， 半 年 内 增 
加 的 身高 吧 | 


[326.6 — [_ 326.8 
( 26S +1723) 人 CT1733 


326.6 
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ee +1133)-(-24£ naa) 


é 


l 
1 年 间 所 长 高 的 身 
高 ， 再 除 以 1。 入 


“(6+0.5) 
岁 ” 对 吗 ? 


(Gab) 


那么 “从 6 岁 到 (640.5) ¥ ik 0.5 年 间 
身高 的 年 平均 增长 率 "” 就 是 这 样 。 


EEN 


一 Cm/ 年 


0.5 年 间 所 长 
高 的 身高 ， 再 





考虑 一 下 “ 极 短 时 间 ” 内 
高 


用 含有 A 的 式 子 来 表示 
“从 6 岁 到 6 岁 之 后 的 极 
短 时 间 内 ”所 长 的 身高 


也 就 是 说 ,“ 从 6 岁 到 6 岁 之 
后 的 极 短 时 间 内 ， 身 高 的 年 平 
均 增长 率 ” 就 是 这 样 的 。 


人 





3266 mp9) [326 A 
(Zma) 7 +1) rans 


A 2 A 
326.6 , 326.6 
(6+4) 6 A | 
= = 326,6x———_x— 
A “66+A) A 
326.6 326.6 


I 
ERT ye 
E TETA 


326.6x(1 “aia /一 一 一 
i; | 

a AEGA 53266x —. ee gE el 

二 


人 6(6+0) 


326.6 x 6+4) -6 
ES 6(6+A) 


A 


只 要 有 耐心 ， 计 算 并 
不 是 很 国难 吧 ? 
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“Ax? axy ahaaa, SHH 
年 平均 增长 率 ” 要 怎样 用 式 子 进行 表示 ? 





最 后 变 成 326.6X 直 了! 


刚才 做 的 “从 ?= -20.6 4173.3 来 出 326.6 x 十 的 过 程 ， 


就 是 所 谓 的 y=- 768 4173.3 ee MD, 


RT y= — 2266 + 173°3, 


1 
126.6% 一 i 
Se ne 我 们 还 要 试 着 对 其 他 式 子 求 


向 分 ， 你 要 尽快 习惯 这 种 运 
TANI FFRAN] 
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( ye, 关于 x 进行 微分 | 


( Ye, KF x MAT MD | E :让 


因为 (xt Ax? __[C+A)+x][Cx+A)-z] _ (xt A)x A _ 
A A A 3 
































2x+ A 





pi D 
~ 2xt0=2x, SE =2x。 
+0=2x, E =2x。 











[二 ， 关 于 x 进行 他 分! ae 




















1 E eri) _ -A 
因为 xtA CrAN _ GHAN JaA a 
A A A @tAy A 


=! va 


GAYE Gtr 





























mr 下 
| yok, RF xi MD, 



































1 1 
(ray x pW 
A 1 Vy C+tAx (+Ax A 
2 2 i 
1 1 t 
GQ | „I&A 
A | [œ +A]? 
人 1 ae 1 ') ! 
_ ra TY 人 x+A 7x ! +0) 
4 | [e+ ORT 
x+e+A x-@+A) | 
te rr | 2 
加 A | xt 
2x+A =å | 
GFA) ” K+ A bee 
A Vell Ae 
i | 
IRE hoy EY | 
wit, 2=-2e" a 
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| aes 























all Sa a 


y 关于 x 进 行 微分 。 > 








[5@ + A) - 71°- (5x - 7} 
A 





3 {[5(x+ A) - 7] + (5x - THIS(x + A) - 7] - (5x - 7)} 
A 





[2(5x -7 + 5A] x 5A | 
A 

= [2(5x—7)+5A]x5 

~ [2(5x—7)+5x0]x5 | 

= 2(5x -Tx5 


因此 ， 2 =2(5x-7) x 5o 
~ SR ， 


af, 
SA 


















= 
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MW 















首先 ， 是 矩阵 的 书写 规则 。 
n+- yep, (1 Dfa 
tin | re 5 ait fi I) (:) 


air, 可 以 写作 : f 站 
3x, + 4x, 3 4)lx 













Cia: 
k,+ 2k+ 3k= -3 a? FS -3 
4k,+ 5k+ 6k = 8 4 5 CJK 8 
Th+ 8+ %= 6 TUSE: | 7 8 9 lkl=| 6 
10k, + 1lk+12k= 2 10 11 12 Wk, 2 
13k, +14k+15kh= 7 13° 14. as uh 
k+ 2k,+ 3k, I. E 3 
4k, + Sk,+ 6k, 4 5 D 
Tk+ Bkt 9k TAKE: | 7 8 Olle | 
10k, + 11k, + 12k, 10 11 12k 
13k, + 14k, + 15k, B M 15) 
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Sea a 


T 











其 次 我 们 来 讲 一 下 矩阵 的 加 法 : 
12 45 12) (45 
mls Jal Sm 6) 


+ a 1+ 4 2+5 
的 计算 可 按 如 下 方式 进行 per a 





例 1 


(JE 


wnat (5 HE lM os 


-9) (-3 10) (6+3) (-9) +10 

H 
Le) [Ps E, 
oe ae 
7 8 9|+|-7 -3 10 
10 11 12 # 2-1 
13 14 15) (7 1-9 
可 按 如 下 方式 计算 : 
1+ 7 2+ '2 Wh 9 
E E A A E 7-4 4+(-1) 5+ 7 64(-4){ |312 2 
7 8 9|+|-7 -3 10|=| 7+(-7) 8+(-3) 9+10 |=| 0 5 19 
10 11 12 Ssi 10+ 8 11+ 2 124(-1)] |18 13 11 y 
a4 E A ba ft os 134 7 14+ 1 15+(-9)) (20 15 6 
=== a -| 


Aa 
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V2, 


x, + 2x, a] y, + 2y, 


3x, + ane 3y, + 4y, 





接 下 来 ， 我 们 讲 讲 矩 阵 的 乘法 。 


ae | 虽说 是 “乘法 ”， 其 实 就 是 将 


[ ae Ja | 网 单独 运算 ， 也 就 是 表示 同时 计算 
3 X 3 4i» 








1 人 - ee lt 

3 4 八 4) \3x54+4x4) — 

因此 ， 可 得 | 让 ‘).(° 
3 al2 4) 4 


45 61(k Lh mn 
78 9h hmm 
10 11 12;\k h m n 








l A | 可 进行 如 下 计算 


1 “I 4) -[ixsvanca) 
3 4 八 -2) \3x4+4x(C2)) 


0 
i 
i 


的 计算 : 











| 
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Wea k+ 2k+ 3k, 

4 5 TEk 4k, + Skh+ 6k, 
8 OW k=] Th+ 8k+ 9k 

10 11 12 |k 10k, + 11k, + 12k, 
13 14 15 13k, + 14k, + 15k, 
3 i+ 2+ 34 

4 6 If, 4l, + 5h + 6l, 
7 OWL |=] 7L+ 8+ 9, 
10% M12 1G 10/, + 114, +121, 
13 14 15 134, + 14l, +151, 
i Oe E | m+ 2m+ 3m, 
4 5 6 lfm, 4m,+ Sm,+ 6m, 
7 8 9 Yim, |=] 7m+ 8m,+ Im, 
10 11 12 lm, 10m,+ 11m,+ 12m, 
139-14: 15 13m,+ 14m,+ 15m, 

H ' O38 n+ 2n,+ 3n, 

4 5 Ek 4n,+ Sn,+ 6n, 

é 7 8 n,|=| 7m+ 8n,+ 9n, 
10 11 12 fn, 10m + 11n, + 12n, 
13. 14). 15 13n, + 14n, + 15n, 
因此 ， 可 得 : 

大 + 2k,+ 3k, l+ 24+ 31, 
4k + 5k+ 6k, 4l, + 5l, + 6l, 
Tk, + 8k,+ 9k, 7, + 81, + 9l, 
10k, + 11k, + 12k, 10/, + 114, +121, 
13k, + 14k, + 15k, 131, + 141, +151, 


] 
| 
| 
| 


m+ 2m + 3m, 
4m,+ Sm,+ 6m, 
Tm+ 8m,+ 9m, 
10m,+ 11m,+ 12m, 
13m,+ 14m,+ 15m, 


n+ 2n,+ 3m 
4n,+ Sm+ 6n 
Tn, + 8n,+ 9n, 
10n, + lin, + 127, 
13n, + 14n, + 15n, 
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DT 
相 乘 后 得 到 | 。 1 








最 后 ， 我 再 对 逆 矩 阵 做 一 些 讲解 


的 逆 矩 阵 
34 4 





[1% (-2)4+2x15 1x1+2x(-0.5))_{1 
3x (-2)+4x1L5 3x1+4x(-0.5) va 


a 
_(y2 
( 


( 


) omen. 








12 
3 4 
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数值 大 致 可 以 分 为 “可 测量 ”数据 和 “不 可 测量 ”数据 两 种 。 其 中 ,“ 可 测量 ” 
数据 被 称 为 数值 数据 ( numerical data), “不 可 测量 ”数据 被 称 为 分 类 数据 (category 
data 或 categorial data )。 

数值 数据 和 分 类 数据 在 记录 上 的 具体 差别 如 表 1.1 所 示 。 


OF 1.1 数值 数据 和 分 类 数据 的 具体 实例 






主要 的 读书 场所 性 别 
















A 火车 ae 

B 2 19 家 男 

€ 10 18 咖啡 厅 男 

D 14 22 图 书馆 女 
数值 数据 分 类 数据 


分 析 者 也 可 以 通过 一 些 方法 将 数值 数据 变换 成 分 类 数据 ， 或 者 将 分 类 数据 变换 成 
数值 数据 。 


数值 数据 变换 成 分 类 数据 的 例子 如 表 1.2 所 示 。 


ORAR 数值 数据 变换 成 为 分 类 数据 举例 
每 个 月 读书 量 
(W) 











在 变换 时 还 要 注意 ,“ 少 ” “中 ”"、“ 多 ” 之 间 的 分 界线 是 多 少 ， 这 是 需要 分 析 者 
做 出 相应 判断 的 。 
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分 类 数据 变换 成 为 数值 数据 的 例子 如 表 1.3 所 示 。 
OR 1.3 分 类 数据 变换 成 为 数值 数据 举例 


最 喜欢 的 季节 








这 里 再 对 分 类 数据 变换 成 为 数值 数据 的 例子 稍 作 说 明 。 对 于 上 表 中 的 变换 ， 在 
实际 操作 中 我 们 一 般 采 用 下 表 的 形式 。 


OR 1.4 分 类 数据 变换 成 为 数值 数据 举例 ( 3 列 ) 
最 喜欢 的 季节 春 


= 





coo 
o-oo 





同样 地 ,例如 我 们 在 变换 “星期 几 ” 时 会 采用 6 列 , 在 变换 “月 份 ”时 采用 11 列 ， 
在 变换 “性 别 ” 时 采用 1 列 。 在 表 1.4 中 ,虽然 我 们 省 略 的 是 表 1.3 中 “ 冬 ” 的 那 一 列 ， 
但 是 ,如 果 我 们 不 省 略 “ 冬 ”而 省 略 “ 夏 ”的 那 一 列 也 是 正确 的 。 以 此 类 推 ,省 略 “ 春 ” 
或 者 “ 秋 ” 都 没有 关系 。 

为 什么 特意 省 略 了 一 列 呢 ? 是 由 于 以 下 原因 : 

.如果 没 有 省 略 其 中 某 一 列 ， 而 直接 使 用 像 表 1.3 那样 的 数据 进行 重 回归 分 析 的 
话 ， 在 数学 上 是 没有 办 法 求解 的 。 

,虽然 省 略 了 一 列 ， 但 是 表达 的 意思 是 一 样 的 〈 例 如 表 1.4 中 的 “ 冬 ” 可 以 通过 
“0-0-0” 进 行 表示 )。 再 进一步 讲 ， 那 一 列 的 存在 本 身 也 是 没有 意义 的 ， 即 便 省 略 了 
也 是 合理 的 。 
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8 8. 离 差 平方 和 、 方 差 、 标 准 差 & 





美 羽 和 理 纱 与 打工 的 同伴 一 起 去 唱 卡拉 OK。 她 们 每 5 人 一 组 ， 分 成 两 组 依据 
演唱 得 分 进行 比赛 。 比 赛 结果 如 表 1.5。 


9 表 1.5 卡拉 OK 的 评分 结果 






















RHA (得 分 ) 理 纱 组 (得 分 ) 
RH 48 理 纱 67 
WF 32 明日 香 55 
RF 88 奈奈 6l 
真 野 61 FJL 63 
71 丽 香 54 
60 平均 60 
将 上 表 画 成 图 便 可 得 到 下 图 。 
RPA 



































en [EF] 
a 上 一 全 Ht 一 本 一 二 一 二 这 


0 10 20 30 40 50 60 70 80 90 100 





理 纱 组 








RR 
mah FJL 

Be | 理 纱 

| 一 一 上 一 天 一 d tt 

9 10 20 30 40 50 60 70 80 90 100 
图 1.1 卡拉 OK 的 评分 结果 
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虽然 美 羽 组 和 理 纱 组 的 平均 得 分 同 为 60 分 ， 但 具体 的 情况 却 差别 很 大 。 美 羽 组 
这 方 ,每 个 人 的 得 分 是 不 是 分 布 得 很 不 均匀 呢 ? 也 就 是 说 数据 的 “分 散 程度 ”比较 大 。 

人 们 通常 采用 离 差 平方 和 、( 总体 ) 方差 和 ( 总 体 ) 标准 差 作 为 表征 数据 的 “ 离 
散 程度 ”的 指标 。 这 些 指标 都 具有 如 下 性 质 : 


。 最 小 值 为 0 
。 数 据 的 “离散 程度 ” 越 大 ， 它 们 的 值 也 就 越 大 


离 差 平方 和 ， 常 常会 出 现在 以 回归 分 析 为 代表 的 多 种 分 析 方法 的 计算 过 程 中 。 
离 差 平方 和 = (每 个 数据 -平均 值 相 加 之 和 
通过 上 述 计算 便 可 求解 出 离 差 平方 和 的 值 。 然 而 数据 的 个 数 越 多 ， 它 的 值 也 就 
会 变 得 越 大 ， 这 也 成 为 它 的 一 个 致命 的 缺点 ， 所 以 在 实际 操作 中 我 们 很 少 使 用 它 作 
为 表征 “离散 程度 ”的 指标 。 
(总 体 ) 方差 ， 解 决 了 离 差 平方 和 的 缺点 。 可 以 通过 如 下 计算 求 得 它 的 值 。 


离 差 平方 和 


CARO 方差 = a RB 


(总 体 ) 标准 差 ， 从 本 质 上 讲 与 ( 总体 ) 方差 是 相同 的 。 可 以 通过 如 下 计算 求 得 
它 的 值 。 


(总 体 ) 标准 差 = (总 体 ) 方差 


让 我 们 来 求 一 下 美 羽 组 和 理 纱 组 的 离 差 平方 和 、( 总 体 ) 方差 和 ( 总体 ) 标准 











差 吧 ! 
ORG ” 美 羽 组 和 理 纱 组 的 离 差 平方 和 、( 总 体 ) 方差 和 ( 总 体 ) ME 
na 理 纱 组 

(48-60)'+ (32-60)'+ (88-60)'+ (61 -60)'+ (71-60) | (67—60) +(55—60) +(61 —60) +(63- 60} +(54-60)° 
离 差 平方 和 “| =(-127+(287+284+ 1+11 =T+CS+E+324+ 人 人 

=1834 =120 
(总 体 ) 方差 | 3668 -a 
(总 体 ) 标准 差 | V3668 =192 V4=49 








注 : 在 方差 中 ， 也 有 不 采用 “数据 个 数 ”而 采用 “数据 个 数 -1” 作 为 分 母 的 情况 、 我 们 将 其 称 为 样本 方差 。 由 于 
所 限 ， 这 两 种 方差 的 区 别 在 本 书 中 就 不 做 讨论 了 。 
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& 9. 概率 密度 函数 & 





国 9. 1 X? 分 布 
在 统计 学 中 ， 常 常会 出 现下 面 介绍 的 概率 密度 函数 。 


1 fide ， 。 - 工 
RSE Oe ES x>0 时 ， 





0 xs0 时 
如 果 x 的 概率 密度 函数 满足 上 述 条 件 的 话 ， 在 统计 学 中 我 们 就 将 其 表述 为 “x 
服从 自由 度 为 OO 的 xat” o 
“自由 度 是 什么 ?”“， 这 或 许 会 让 读者 摸 不 着 头脑 。 其 实 “ 自 由 度 是 什么 ”这 个 
问题 就 相当 于 在 问 “ 一 次 函数 /(x)=ax+b 中 的 a 是 什么 "。 所 谓 自由 度 ,不 过 就 是 “ 影 
响 函数 图 像 形状 的 一 个 值 ”而 已 ， 除 此 之 外 便 没 有 其 他 意义 了 。 
BARR 2 的 情况 


[os 


0.4 








0.3 
0.2 
0.1 


0 
0 5 10 15 


BAHEA 10 的 情况 
01 


六 
S 











0.05 














50 第 1 章 基础 知识 





在 实际 应 用 中 ， 存 在 一 种 叫做 “ 妇 分 布 表 ”的 表格 。 使 用 这 个 表格 ， 我 们 就 可 
将 与 下 图 中 斜 线 部 分 的 概率 (= 面积 ) 已 相对 应 的 横 轴 坐标 查找 出 来 。 图 中 的 x2 ie 


做 “ 卡 方 "。 





£ 


FERRNA — RLR 








R17 DR 
0.995 0.99 | 0.975 | 0.95 0.05 | 0.025 | 0.01 | 0.005 
自由 度 

1 0.000039 | 0.0002 | 0.0010 | 0.0039 | 3.8415 | 5.0239 | 6.6349 | 7.8794 
2 0.0100 | 0.0201 | 0.0506 | 0.1026 | 5.9915 | 7.3778 | 9.2104 | 10.5965 
3 0.0717 | 0.1148 | 0.2158 | 0.3518 | 7.8147 | 9.3484 | 11.3449 | 12.8381 
4 0.2070 | 0.2971 | 0.4844 | 0.7107 | 9.4877 | 11.1433 | 13.2767 | 14.8602 
5 0.4118 | 0.5543 | 0.8312 | 1.1455 | 11.0705 | 12.8325 | 15.0863 | 16.7496 
6 0.6757 0.8721 1.2373 1.6354 | 12.5916 | 14.4494 | 16.8119 | 18.5475 
7 0.9893 | 1.2390 | 1.6899 | 2.1673 | 14.0671 | 16.0128 | 18.4753 | 20.2777 
8 1.3444 | 1.6465 | 2.1797 | 2.7326 | 15.5073 | 17.5345 | 20.0902 | 21,9549 
9 1.7349 | 2.0879 | 2.7004 | 3.3251 | 16.9190 | 19.0228 | 21.6660 | 23.5893 
10 2.1558 2.5582 3.2470 3.9403 | 18.3070 | 20.4832 | 23.2093 | 25.1881 


























i i i i : 
<=> 
当 P 为 0.05、 自 由 度 为 2 的 时 候 ， 和 的 值 为 5.9915。 
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9.2 FS 
在 统计 学 中 ， 常 常会 出 现下 面 介绍 的 这 种 概率 密度 函数 。 




















me moan ane 
fix h e 应 jx( 第 ! 自 由 度 ) ”7 ”x (第 2 自由 度 ) T ys- 
/= ET m mE per 
(Fx 2 eds) [ox aoe a) inamaana 


0 


如 果 x 的 概率 密度 函数 满足 上 述 条 件 的 话 ， 在 统计 学 中 我 们 就 将 其 表述 为 “x 
服从 第 一 自由 度 为 OO、 第 2 自由 度 为 x x 的 严 分 布 "。 
国 第 1 自由 度 为 5、 第 2 自由 度 为 10 的 情况 


0.7 
0.6 
0.5 
0.4 
0.3 
0.2 
0.1 

0 








2 4 6 8 10 





Ei 自由 度 为 10、 第 2 自由 度 为 5 的 情况 


0.7 
0.6 
0.5 
0.4 
0.3 
0.2 
0.1 

0 




















0 2 4 6 8 10 





52 第 1 章 基础 知识 


x>0 时 ， 


x<0 时 


在 实际 应 用 中 ， 存 在 一 种 叫做 “FF 分 布 表 ”的 表格 。 使 用 这 个 表格 ,我 们 就 可 
将 与 下 图 中 斜 线 部 分 的 概率 (= 面积 ) P 相 对 应 的 横 轴 坐标 查找 出 来 。 


所 第 1 自由 度 , 第 2 自由 度 ; P) 
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下 面 是 我 们 节选 的 一 部 分 严 分 布 表 : 
R18 尸 为 0.05 时 的 FSH 





Lt pe 
CU | eo ee ee ee ee : 
第 2 自由 
1 161.4 | 199.5 | 215.7 | 224.6 | 230.2 | 234.0 | 236.8 | 238.9 | 240.5 | 241.9 





2 18.5 19.0 | 192] 19.2] 193 19.3] 194] 194] 194] 19.4 
3 10.1 9.6 9.3 9.1 9.0 8.9 8.9 8.8 8.8 8.8 
4 7.7 6.9 6.6 6.4 6.3 6.2 6.1 6.0 6.0 6.0 
5 6.6 5.8 5.4 32 | 5.0 49 48 48 47 
6 6.0 Si 4.8 45 44 43 4.2 41 41 41 
7 5.6 47 43 41 4.0 3.9 3.8 3.7 3.7 3.6 
8 5.3 45 4.1 3.8 37 3.6 35 3.4 3.4 3.3 
9 5.1 4.3 3.9 3.6 3.5 3.4 33 3.2 3.2 ad 


10 5.0 41 37 35 33 3.2 3.1 3.1 3.0 3.0 
11 4.8 4.0 3.6 3.4 3.2 3.1 3.0 2.9 29 2.9 


12 4.7 3.9 3.5 33 3.1 3.0 29 2.8 2.8 2.8 


i í 3 i 3 f : : t i : $ 
+% 1.9 P> 0.01 时 的 广 分 布 表 


1 自由 度 | 











第 3 自由 1 2 3 a 5 6 7 8 9 10 

1 4052.2 | 4999.3 | 5403.5 | 5624.3 | 5764.0 | 5859.0 [5928.3 | 5981.0|6022.4 | 6055.9 
2 98.5] 99.0] 99.2] 99.3] 99.3] 99.3] 99.4] 99.4] 99.4] 99.4 
3 34.1) 30.8] 29.5} 28.7) 28.2} 27.9! 27.7] 27.5] 273| 27.2 
4 21.2 18.0} 16.7| 16.0] 15.5} 15.2] 15.0]° 14.8| 14.7| 14.5 
5 16.3 133| 121 11.4) 11.0) 10.7| 10.5| 103| 10.2| 10.1 
6 13.7| 10.9 9.8 9.1 8.7 8.5 8.3 8.1 8.0 19 
7 12.2 9.5 8.5 7.8 7.5 12 7.0 6.8 6.7 6.6 
8 11.3 8.6 76 7.0] 6.6 6.4 6.2 6.0 5.9 5.8 
9 10.6 8.0 7.0 6.4 61 5.8 5.6 33 5.4 5.3 
10 10.0 7.6 6.6 6.0 5.6 5.4 5.2 51 49 48 
11 9.6 7.2 6.2 3.7 33 3.1 49 47 46 45 
12 





9.3 6.9 6.0 5.4 5.1 48 46 45 44 43 



































D> 
当 P 为 0.05、 第 1 自由 度 为 1、 第 2 自由 度 为 12 的 时 候 ,也 可 以 记 作 严 (第 1 
自由 度 , 第 2 自由 度 ; P)， 即 F(1，12; 0.05) 的 值 为 4.7。 
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今天 我 们 来 学 习 你 
期 待 已 久 的 回归 分 
WE! 
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22H (—) 

这 个 表 就 是 根据 “最 高 气 23 日 (二 ) 
温 ” 和谐 伦 的 “ 冰 红 茶 的 24 日 三 ) 
销售 量 ”总 结 出 来 的 。 25 日 (四 ) 
26 日 五 ) 

是 老板 告诉 我 的 。 27H GX) 
28H (H) 

29H (—) 

30H (=) 

31H (=) 

1 日 (四 ) 

2 日 五 ) 

3 日 (六 ) 








HZ 由， 
PK 将 这 些 数据 用 散 点 图 





我 们 先 不 讲 如何 计 算 ， 只 须 
知道 “最 高 气温 ”和 “ 冰 红 茶 
的 销售 量 ”的 单 相关 系数 的 值 
是 0.9069。 











sols en 

20 21 22 23 24 25 26 27 28 29 3031 32 33 34 35 因为 2 个 变量 的 关联 程度 越 

最 高 气温 (C ) 大 ， 其 单 相 关系 数 的 值 就 越 
接近 土 |， 所 以 我 们 就 可 以 说 
它们 的 关联 程度 相当 大 。 
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所 以 ， 天 气 越 热 
AFRA! 


也 是 啊 ， 不 过 如 果 这 些 
数据 仅仅 是 用 来 求 单 相 
关系 数 的 值 ， 那 就 太 没 


分 析 要 出 场 唆 ! 








ae 不 过 ， 我 觉得 这 
RAR ARSE 


就 可 以 根据 最 高 
气温 米 预 测 冰 红 
茶 的 销售 量 啦 ! 
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È 
分 析 


ANL A 





冰 
红 
® 
销 
售 
量 
杯 


SHBevaeress 
(JER: 





Sesewvae 





D2 2 23 2 BB 2 WH 303) 32 B HIS DU 2 23% 25 2 2 WH 303) 32 BAE 
RRR) 最 高 气温 (C ) 


不 就 可 以 预测 出 
BST CHER 
卖 出 多 少 杯 了 吗 ? 
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怎么 觉得 回归 分 析 
看 起 来 这 么 简单 。 


那么 ， 请 尽快 教 我 回归 
BALM RMA KE | 


做 回归 分 析 呢 ， 并 不 
是 说 求 出 回归 方程 就 
可 以 了 。 


有 时 要 确认 回归 方程 的 
精度 ， 有 时 要 推测 总 体 
的 | 


有 各 种 各 样 需要 去 做 的 
事情 


o 
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& 2. 回归 分 析 的 实例 & | ( monine 
这 样 的 1 















人 首先 ， 为 了 讨论 是 否 具有 求解 回归 方程 的 意义 ， 
画 出 自 变量 和 因 变 量 的 散 点 图 。 








@ 求解 回归 方程 。 


@ 确认 回归 方程 的 精度 。 















@ 进行 回归 系数 的 检验 。 





© 总 体 回归 Ax+B 的 估计 。 
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PPINSRA 


a 


这 就 是 全 部 了 吗 ? 


AN, AMT, 
分 析 也 就 结束 了 。 





那么 ， 就 让 我 们 用 诺 伦 
的 数据 做 一 次 实际 的 回 
BAM! 


@ 首先 ， 为 了 讨论 是 否 具有 求解 回归 方程 的 意义 ， 画 出 自 变 量 和 
因 变 量 的 散 点 图 


20O) 
BE) 
mH) 
asnan 
PRRI 





先 画 出 自 变 量 和 因 变 量 的 四 这 是 理 纱 前 车 
kan! 20 21 22 23 24 25 26 27 刚刚 画 好 的 图 ， 
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从 这 些 数据 看 来 

“最 高 气温 ”和 “ 冰 红 茶 
的 销售 量 ”具有 很 强 的 相 
关 性 。 


单 相关 系数 的 值 ， 也 要 比 
实际 的 0.9069 略微 大 一 


专门 来 做 这 样 的 
事情 有 必要 吗 ? 


可 以 说 是 具备 求解 回归 方程 的 
意义 ! 


WaT, hy 











散 点 图 是 很 重要 


y=0.21+64,5 * 








m0 21 22:23 24.28 26 27-29 0H) 3233-4 95 


mara (x 


看 看 这 个 ， 从 给 出 的 数据 来 
看 ， 这 两 个 变量 怎么 看 也 不 像 


64 #28 回归 分 析 


awae) 


但 是 从 数学 上 ， 仍然 可 以 求解 
出 基本 的 回归 方程 | 





© 求解 回归 方程 


那么 接 下 来 | 我 就 要 
RMF ALK | 


它 的 计算 过 程 ， 包 含 
以 下 6 NDR: 





在 图 中 这 些 坚 线 长 度 
的 平方 之 和 达到 最 小 
时 , Rik a fo bo 


ok 
p 
Z% 
销 
售 
ž 
€ 


100 
95 
40 
& 
s 
15 
w 
“a 
60 
kd 
5 


25 % XT 28 7 303) 32 B HI 这 种 思考 方法 就 是 
最 高 气温 (C) KAH “Rob ake 
法 "。 


RX) EPH 1059 510) BRA HOS (KB 
XFOYG HB ARIS, BPS, Sw, Seve 


ID rarr. 

ID EX Fanbkth, wx, 
GD mose. 

GD snr. 

D «10058. 
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22 日 ( 


na) 
24 日 (三 ) 
25 日 (四 ) 
26 日 五 ) 
27 日 (六 ) 
28 日 (日 ) 
29 日 (一 ) 
30 日 (二 ) 
31A(=) 
1 日 (四 ) 
2 日 五 ) 
3 日 (六 ) 
4 日 (日 ) 


29 
28 
34 
31 
25 
29 
32 
31 
24 
33 
25 
31 
26 
30 


77 
62 
93 
84 
59 
64 
80 
75 
58 
91 
51 
73 
65 
84 


RIH x 的 离 差 平方 和 8。 的 值 
ORIG y 的 离 差 平方 和 S, 的 值 
ORM x All y 的 离 差 积 和 5, 的 值 


-0.1 


49 
1.9 
-4.1 
-0.1 
249) 
19 
-5.1 
3.9 
4.1 
1.9 


0.9 


3.4 
9.9 
0.7 


19.6 
111.8 
417.3 
130.6 
184.2 
73,5 
55.2 
5.9 
212.3 
339.6 
465.3 
0.2 
57.3 
130.6 


-0.6 
12.1 
99.2 
21.2 
56.2 

1.2 
21.2 

4.5 
74.9 
71.1 
89.4 

0.8 
23.8 

9.8 








0 





总 计 408 1016 
平均 29.1 72.6 





l 


z 
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| 
7 








| 


Su 


| 
S 








129.7 2203.4 484.9 


t 
Sy 


人 下面 给 出 的 是 具体 的 运算 过 程 


KP “y 
An 


"y3 


22 日 一 ) 
23H (=) 
24H (=) 
25 日 (四 ) 
26H 五 ) 
27 日 六 ) 
28 日 (日 ) 
29 日 (一 ) 
30 日 (二 ) 
318 (=) 
1 日 (四 ) 
2 日 五 ) 
3H (A) 
4 日 (日 ) 


”叫做 实测 值 。 


4b ”叫做 预测 值 。 
叫做 残 差 ， 一 般 用 “e” 来 表示 。 


ax29+b 
ax28+b 
ax34+b 
ax31+b 
ax25+b 
ax29+b 
ax32+b 
ax31+b 
ax24+b 
ax33+b 
ax25+b 
ax31+b 
ax26+b 
ax30+b 


77- (ax 29 +b) 
62- (ax 28 +b) 
93- (a x 34 + b) 
84- (a x31 +b) 
59 — (a x 25 + b) 
64- (a x 29+ b) 
80- (a x 32 + b) 
75- (ax31 +b) 
58- (a x 24 + b) 
91- (ax 33 +b) 
51- (ax 25 +b) 
73-(ax 31+) 
65 — (a x 26 + b) 
84- (a x 30 + b) 


[77 - (a x 29 + bP 
[62 — (a x 28 + b)P 
[93 — (a x 34 + b)? 
[84 - (a x 31 + b)? 
[59 ~ (a x 25 + b)? 
[64 ~ (a x 29 + b)? 
[80 — (a x 32 + b)? 
[75 - (a x 31 + DY 
[58 - (a x 24 + bP 
[91 — (a x 33 + b)? 
[51 - (a x 25 + b)}? 
[73 - (a x31 + b)? 
[65 ~ (a x 26 + b)]? 
[84 - (a x 30 + b)}? 





总 计 


408a + 14b 


1016 — (408a + 14b) 





平均 








=Ratb 


291a+b | 


172.6 — (29.1a + b) 





=p— (ža +b) 





我 们 将 上 表 中 的 y- 值 逐 列 相 加 ， 也 就 是 将 e? 相 加 ， 
将 其 称 为 “ 残 差 平方 和 "， 一 般 用 Se 表示 。 
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ED 对 残 差 平方 和 5, 关于 a 和 4b 求 微分 ， 并 使 其 为 0。 


图 ”对 a 微分 
Taz [77 — (29a + b)] x (-29) + ++ + 2 [84 — (30a + b)] x (-30)=0 


ROH 


Fe 22 177-2904 6)1 x+ +2 [84 — 200 +b] x1) =0 


ED 对 步骤 3 的 D 和 @ 进 行 整 理 


E ”整理 D 式 
2177 — (29a + b)] x (-29) + +++ + 2[84 - (30a + b)) x (-30) =0 


(77 = (29a + b)] x (-29) + ++- + [84 ~ (30a + b)] x (-30) =0 
29[(29a + b) = 77] + +++ + 30[(30a + b) — 84] =0 由 上 趟 变形 可 得 中 请 仔细 比较 5 


(29 x 29a + 29 x b — 29 x 77) + +: + (30 x 30a + 30 x b — 30 x 84) =0 
(29 + ++ + 30°)a + (29 + + + 30)b — (29 X77 + = +30 x 84) = 0 


E temas 
2[77 ~ (29a + b)] x (-1) + ++ + 2[84 — (30a + b)] x (-1) =0 


[77 — (29a + b)] x (-1) + = + [84 — (30a + b)] x (-1) =0 
(250+) —771 +--+ (Goa +) -01 -0 ER 


(29+: +30)a +b +: + b= (77 + + 84) =0 


(29 + +++ +30)a+ 14b — (717 + + +84)=0 


14b = (77 + ++ + 84) — (29 + ++ + 30)a Ba 
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ED KER HORA LH 4 HHO 


(29 + 7+ 30)a 29 ++ +m (Zt Brata a) aor +m 430x88)=0 


14 14 





+ +3077 +: +84) _ (29+ +30)" 


14 iz a (29X77 + ++ +30 x 84) =0 





> 2ga 29 
(29 +o +30 at 
29 
(29% + +30) 
PA sa 
(9+ +30) — 


(297 +30 
(29+… 


= QP +e 


= (29 ++ +30") — 2% (29-4 +++ +30) B+ (F) 14 eR 


(29° + +30") — 2x (29+ +30) XEHE HHE 


=[29-2x29 
(29 -F) +o 
=s, 


(ama) 


(29X77 +++ 





=Q9XTT Ho 
=(29x77 +- 
= (29x77 4 
= (29X77 + 


= Q9K TT + 
=(29x ITH 


É (29 + +++ + 30)(77 + ++ + 84) 
Derawan roxi BM 489 Ee N 





(29 
yg 


ne 
4 


4 
E+ (EY) ++ [30 -2x30x7+(3)}] 
+(30-3) 


+ 30x gay- 294 + BONT + + 84) 


29-4430 774 
+30 x 84) — ad ee 


+30 x 84) Fx Fx 14 


14 


1+30x89-3x7x14-7x5x14+7x5x 14 ~M 


29+ 77+…+84 


x7x 14 Ex Ta x 14+ Ex Fx 1d 





+30 x 84) = 
+30 84) — (29-4 +- + 30)7— 3077 + 
+30 x 84) — (29+ + 30)7— (77 十 … + BAR +3 xY + y 








84)+3x5x14 





= (29X77 ~ 299-7754) +--+ + (30 x 84-307- 847+ 3x7) 
= (29 ~3)(77 - 5) + +» + (30 = (84-5) 


=S, 
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ap 求解 回 昌 方程 ; 
根据 步 又 5 中 的 @ 可 知 ， ane o 根据 步骤 4 中 的 @ 可 知 ,5= 了 -Fa 。 
因此 ， 根 据 步骤 1 可 知 > 


Sy _4849 _37 


We by 


b=y-xa=72.6—29.1 x3.7=-36.4 


所 以 ， 回 归 方程 为 


y=3.7x- 36.4 





不 仅仅 限于 这 个 例子 ， 凡 是 求 回归 方程 
的 a 和 的 值 ， 都 可 以 做 加 下 计算 。 


guy ih Biche Sy 
xR EPH ~ Su 


(XJ nea BH 


00 
g% 
90 
站 
7 
o 
65 
bo 
站 
5 


a boia ni 
Z0 21 X 23 24 I5 26 2728 29 30 31 32 3 H% 





回归 方程 是 
Y=3.7x-36.4 
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虽然 这 个 与 计算 
没有 直接 关系 
但 由 于 比较 重要 
所 以 要 先 说 明 一 







ri a 
1 








Bass 


LS eres Severe 
20 21 QB WW 26 27 WH 30 3! 3233 34% 
又 REBA) 





回归 方程 的 图 像 一 定 
经 过 点 (元 F) 





=aat (了 -元 a) 
= AQ-A)+4 


Q(A-A)tF 


QA(A-A)4F 
Ax0tY 
-% 
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@ 确认 回归 方程 的 精度 


那么 ， 接 下 来 让 
我 们 确认 一 下 刚 
刚 求 出 的 回归 方 
程 的 精度 。 


“回归 方程 的 精度 "是 什么 
ROM? 





刚刚 求 出 的 回归 方程 。 








冰 100 

























20 21 22 23 24 25 26 27 28 29 30 31 3233 M 35 
CELTIS] 

















这 么 说 的 话 ， 左 边 这 幅 图 
中 ， 点 和 回归 方程 更 加 吻 
合 一 些 。 
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像 这 样 ， 我 们 把 左 5 不 过 ， 以 看 图 的 方式 来 


图 中 点 和 回归 方程 p HKR, FEA 
吻合 得 好 的 情况 ， / 些 主观 ， 你 说 对 吗 ? 
就 叫做 “回归 方程 

的 精度 较 高 " 或 者 


而 重 相关 系数 说 起 来 
BURP LEAL y 和 
预测 值 了 的 单 相关 系 


回归 方程 的 精度 就 是 用 来 表示 点 和 回归 方程 
拟 合 程度 的 指标 。 





tes Y 和 1 的 离 差 积 和 -Sy ___ 18123 
| [OmeR Ae x mera [Syge /2203.4x1812.3 











原来 如 此 | 


25 日 四 ) 
26 日 五 ) 
27 日 (六 ) 
28 日 (日 ) 
298 (-) 
30H (=) 
31A (=) 
1R (m) 
2A (五 ) 
3 日 (六 ) 
4 日 (日 ) 





























ERRAR R 的 计算 虽然 与 S。 没有 
关系 ， 但 是 对 之 后 的 运算 很 重要 ， 
所 以 要 先 求 出 来 。 
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我 们 将 (AKA)? 
BARA “PR AK, 


通常 ， 记 作 “R”。 


PRAK R 的 取 值 范围 是 


0 到 1。 


回归 方程 的 精度 越 高 ，R? 的 值 
Akiki RZ, Wiki 0。 





平方 以 后 名 字 就 
gane / 
am! 


A R 的 值 大 约 在 
多 少时 ， 我 们 就 可 
以 说 精度 高 呢 ? 





很 抱 娄 ， 在 统计 学 中 
并 没有 这 种 标准 。 


R=(0.90697 
= 0.8225 


是 0.8225。 
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这 可 不 止 是 0.5 以 上 了 
R, 已 经 非常 接近 1 了 。 
所 以 ， 可 以 说 我 们 求 
出 的 回归 方程 具有 很 
高 的 精 


GH) Mme BRT. 
SRSFsaVavgs 





WU 22 23 24 BW MWH HI LBW 
景 高 湿度 (C ) 


eel a ele 
yali 


为 了 节省 时 间 ， 这 里 aes HEI ra 

就 不 作证 明了 ,不 过 ， ` ENN 

这 样 的 关系 可 是 成 立 

的 哟 1 Wh 
Ore 
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: l ao 5 
我 们 再 来 看 一 下 ETHET 比如 说 ， 最 高 

f : z 度 为 31C 的 日 子 Hom 
es ai 出 现 过 几 次 ? $ 


26 日 五 ) 
27 日 (六 ) 
288 (A) 





308 (=) 
3A (5) 
1 日 (四 ) 


3 日 (六 ) 
4 日 (日 ) 








BRA, BA 
这 样 。 


起 想 看 是 不 是 i 以 前 有 很 多 这 种 情况 
EA 今后 同样 会 有 很 多 。 
aR 


还 真是 
那样 的 啊 ! 





Hee Bier 
日 子 向 上 堆积 起 
KS LAR 


25 A, 29 日 和 2 日 应 当 说 是 从 “最 
高 气温 为 31YC 的 日 子 " 这 样 的 总 体 
v 中 随意 抽出 的 三 天 。 


我 明白 所 谓 的 总 体 
是 怎么 一 回 事 了 。 


好 样 的 ! 那 我 们 
Sve | 
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如 果 要 做 回归 分 析 ， 
那么 有 一 个 假设 
是 要 严格 成 立 的 。 


"最 高 气温 为 xC 那 天 的 冰 红 其 销 信 量 ” 
服从 平均 值 为 Ax+R, RAEN OH | 















总 之 ， 对 于 “ 景 高 气温 为 x 必 屠 
ROR EEE ESI 
图 形 来 说 ， 无 论 X 取 什么 值 ， 图 
形 都 是 完全 一 样 的 。 






AWAR 
不 同 而 不 同 啊 


记 住 ， 无 论 准 热 正太 分布 的 
图 形 孝 是 相同 的 ， 这 是 不 需 
要 任何 解释 的 ， 是 回归 分 析 
的 : 





这 样 说 的 话 ， 是 不 是 
就 可 以 想 通 了 ? 
| 
WH 
) 
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OHT “回归 系数 的 检验 ” LP, | 





证 明 过 程 比较 困难 
所 以 就 不 讲 了 





ANA, BENO, È 
计 学 上 常常 会 用 到 它们 ， 在 刚刚 或 出 的 回归 方程 =axtb 中 
* 大约 为 a 
“BAAD 


Se 
+ 0 nT 








“A 约 为 3.7 
。 B 约 为 -36.4 


Er 
8, 回归 方程 是 E lag 4 142 = 


y=3.7x-36.4。 是 这 样 吗 ? 
MAH | 
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学 的 手段 ， 
3 无 法 严格 地 计算 出 4、B 和 
otii. 





RES CHER BY kp 


ROBB Mhp 


2 A RB, 
RAB o WEA 


2h, 









这 样 无 论 最 高 气温 是 多 少 ， 我 们 都 可 以 
断定 冰 红 茶 的 销售 量 是 相同 的 。 















那 、 要 怎么 做 才 可 
以 知道 4 是 否 等 于 
0%? 


那么 ， 我 们 就 以 “0.05” 作 为 
有 意义 的 标准 ， 来 具体 地 做 一 





所 以 ， 就 要 进行 全 


“回归 系数 的 检验 ”1 
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定义 总 体 。 


以 “最 高 气温 为 xY 的 日 子 ”作为 总 体 。 





建立 原 假设 和 备 择 假设 。 


原 假设 为 “4=0”。 
备 择 假 设 为 “4 0"。 





选择 所 要 进行 的 “检验 ”类 型 。 


进行 “回归 系数 的 检验 ”。 





设 定 有 意义 的 标准 。 


以 0.05 为 有 意义 的 标准 。 





通过 样本 数据 求 出 检验 统计 量 的 值 。 


下 面 进行 “回归 系数 的 检验 ”。 
所 谓 “回归 系数 的 检验 ”的 检验 统计 量 的 值 为 
a S. 
el A A 
i 个 体 个 数 - 2 
Su 
所 以 在 本 例题 中 ， 检 验 统计 量 的 值 为 
STA al asg 


1 14-2 
129.7 


在 本 例题 中 ， 如 果 原 假设 成 立 ， 那 么 检验 统计 量 就 
服从 第 1 自由 度 为 1、 第 2 自由 度 为 12 (= 个 体 个 
数 -2 ) 的 严 分 布 。 





再 将 步 又 5 中 求 出 的 检验 统计 量 的 
值 所 对 应 的 己 值 ， 与 有 意义 的 标准 
进行 比较 ， 看 看 P 值 是 否 比 其 小 。 


有 意义 的 标准 是 0.05。 检 验 统计 量 的 值 为 55.6， 所 
以 P 值 为 0.000008。 
0.000008<0.05， 所 以 值 小 。 





如 果 在 步 又 6 中 己 值 比 有 意义 的 标 
准 小 ， 则 我 们 就 可 以 得 出 “ 备 择 假 
设 成 立 ”的 结论 。 反 之 ， 我 们 就 可 
以 得 出 “ 原 假设 成 立 ” 的 结论 。 


有 些 参考 资料 中 ， 不 是 依据 
下 分 布 而 是 依据 1 分 布 来 讲 
解 “ 回 归 系数 的 检验 "。 

这 个 问题 从 数学 的 角度 解释 
起 来 比较 困难 ， 所 以 我 们 不 
做 详细 介绍 。 但是， 无 论 依 
据 哪 种 分 布 ， 其 最 终 的 结论 
都 是 相同 的 。 
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与 有 意义 的 标准 相 比 ，P 值 小 。 所 以 ， 备 择 假设 “4 
天 0” 成 立 。 


党 太 分 布 中 己 值 的 求解 方法 请 参见 第 204 页 





将 “ 某 个 值 以 上 、 某 个 另外 ， 我 们 将 估算 出 的 

值 以 下 ”的 估算 过 程 称 区 间 称 为 “置信 区 间 "。 

为 “区 间 估 计 "。 也 就 是 说 ， 所 谓 的 “一 定 
会 的 可 靠 程度 指 的 就 是 ' 置 
信 度 "、“ 置 信 水 平 ” 或 “置信 
系数 


置信 度 并 不 是 在 求 出 置信 在 刚刚 的 31C 的 例子 中 ， 实 际 上 并 不 是 说 总 
区 间 后 判断 出 来 的 。 体 回归 4X31+B "一定 会 " 位 于 “ 某 个 值 以 上 、 
RMAF", 


实际 上 ， 它 是 在 求解 置信 区 
间 之 前 , 由 分 析 者 自己 "决定 ” 而 应 当 说 ， 当 置 信 度 为 〇 JC) 96 时 ， 总 体 回归 
的 AX31+B 应 该 位 于 “ 某 个 值 以 上 、 某 个 值 以 下 " 


设 定 为 DO % 吧 | 
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Wh KE 


会 是 0~ 120 杯 ， 
ff 49% NDREK] 


xen nae EA 
40 ~ 80 杯 ， 
gl 95% ERTANI 


那样 就 会 导致 置信 区 间 变 长 ， 
也 就 没有 说 服 力 了 。 


那么 ， 你 来 求 一 下 ， 置 信 度 为 
95% 时 的 总 体 回归 4X31+B 
的 置信 区 间 吧 1 
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[ 当 置 信 度 为 95% 的 时 候 ， 总 体 回归 AX31+B 的 置信 区 间 
如 下 : 








OR OEE 
79.5-3.9 = 75.6 aX31+b 79.5+3.9= 83.4 


=3.7X31-36.4 
=79.5 


当 置 信和 度 为 99% 的 时 候 ， 总 体 回归 AX31+B 的 置信 区 间 
只 需要 将 FL1， 样 本 个 数 -2; 0.05) = F(1，14-2; 0.05) = 4.7 
的 部 分 变 成 F(1， 样 本 个 数 -2; 0.01) =F, 14-2; 0.01) =93 


RAF F(1,14-2;0.05)=4.7 等 的 介绍 ， 请 参见 第 54 页 。 


在 置信 和 度 为 95% 时 ， 总 体 回归 
AX31+B 处 于 76 杯 以 上 、83 
杯 以 下 是 这 样 的 吗 ? 
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那么 ， 明 天 的 冰 红 茶 的 
销售 量 会 是 多 少 呢 ? 


刚刚 求 出 的 回归 方程 
是 y=3.7x-36.4 所 以 


GA 3-7x27- 36.4 
=635 
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但 是 ， 实 际 的 销售 量 真 的 
会 刚好 64 杯 吗 


我 觉得 ， 不 会 那么 


无 论 如 何 ， 都 不 会 


ERA) 有 一 个 好 方法 哦 1 


统计 学 中 ， 在 置信 度 为 
OO % 的 条 件 下 最 高 
气温 为 27C 那 天 的 冰 红 
茶 销 售 量 ， 会 处 于 “ 某 
个 值 以 上 、 某 个 值 以 下 " 


Kit, BRARAK 
的 值 是 0.8225 那 总 会 
是 64 杯 左右 吧 


刚刚 所 讲 的 对 

"总体 回归 ”AX31+B 的 估计 
现在 就 可 以 说 成 是 对 
“最 高 气温 为 27 忆 那天 的 冰 红 
茶 销 售 量 ” 的 预测 。 
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对 于 总 体 来 说 ， 我 们 考虑 的 8 对 于 将 来 来 说 ， 我们 考虑 的 
是 如 何 进行 “估计 " ARMAR AN 


我 们 将 预测 出 的 区 间 称 为 

然后 ， 所 谓 的 “一 定 会 
的 可 靠 程度 指 的 是 “置信 
BSE OE 
AK. 


在 相同 置信 度 、 
相同 x 值 的 情况 
下 ， 预 测 区 间 的 
宽度 会 被 设计 得 


计算 方法 也 十 分 相似 ， 为 意外 学 件 所 产生 的 
但 是 有 一 些 细微 差别 。 ae RACLAE. 





当 置信 度 为 95% 的 时 候 ，" 最 高 气温 27° CHR Hkt KAM 
售 量 "的 预测 区 间 如 下 : 


预测 区 间 


mA 


64.6-13.1 = 51.5 aX27+b 64.6 + 13.1 = 77.7 
=3,7X 27-36.4 
= 64.6 


HORSE 











刚刚 的 计算 中 ， 没 有 处 理 好 四 含 五 入 的 关系 。 事 实 上 ， 最 
高 气温 为 27YC 那 天 的 冰 红 茶 销售 量 ， 不 是 64 而 应 当 是 
64.6 ~ 65 。 








学 的 角度 解释 起 来 比较 困难 ， 所 以 这 里 我 们 就 不 做 详细 


通常 ， 在 区 间 的 预测 和 之 前 所 讲 的 总 体 回归 的 估计 过 程 
P, RARE DEARA FIRR, EAA 
介绍 了 。 





总 之 ， 最 高 气温 为 27'C 的 时 候 ， 
冰 红 茶 销 售 量 在 置信 度 为 95% 的 
RAF, SUF 52 杯 以 上 、78 杯 
以 下 对 吧 ? 
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通过 庄 伦 的 数据 ， 真 的 | 
学 到 了 很 多 东西 … 


我 已 经 学 会 如 何 这 个 ， 有 点 言 之 过 早 了 吧 ， 
做 回归 分 析 了 ! 还 要 及 时 复习 啊 ! 
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2 3. 回归 分 析 过 程 中 的 注意 事项 只 





下 图 中 ,我们 再 次 给 出 62 页 中 出 现 的 回归 分 析 的 过 程 : 





四 首先， 为 了 讨论 是 否 具有 求解 回归 方程 的 意义 ， 画 出 自 变量 和 因 变 量 的 散 点 图 。 
z 求解 回归 方程 。 

确认 回归 方程 的 精度 。 

sue “回归 系数 的 检验 ”。 

总 体 回归 AX+B 的 估计 。 

one 








图 2.1 回归 分 析 的 过 程 


此 前 ， 我 们 的 讲解 中 讲 到 ， 必 须 完成 上 图 中 的 第 步 到 第 @ 步 ， 但 事实 上 并 非 
如 此 。 本 系列 的 《漫画 统计 学 》 中 曾 提 到 ， 统计 学 大 致 可 以 分 为 两 类 : 

“推断 统计 学 

描述 统计 学 
那么 ， 请 再 回想 一 下 ， 在 25 页 出 现 的 “ 美 羽 的 年 龄 和 身高 ”的 例子 中 ， 

“ 美 羽 只 是 世界 上 广大 人 和 群 中 的 一 员 。 

+ OP) 10 岁 时 的 身高 137.5cm 也 只 是 其 中 的 “一 个 值 ”。 

基于 以 上 两 个 事实 我 们 可 以 知道 , 18 E 10 岁 时 的 身高 服从 平均 值 为 4x+B、 
标准 差 为 o 的 正 态 分 布 ”等 这 类 的 问题 ， 已 经 没有 思考 的 余地 了 。 就 是 说 ， 像 求解 
总 体 回归 4xctB 的 置信 区 间 ， 以 及 检验 4 元 0 是 否 成 立 这 类 问题 ， 从 推断 统计 学 的 
观点 来 看 ， 已 经 没有 必要 再 进行 分 析 了 。 总 之 ， 就 是 应 当 以 描述 统计 学 的 观点 出 发 
进行 分 析 。 

综 上 所 述 ， 上 图 中 的 第 〇 D 步 做 到 第 @ 步 是 必须 要 做 的 ， 请 尽量 掌握 。 但 是 ， 如 
果 遇 到 像 “ 美 羽 的 年 龄 和 身高 ” 这 类 的 情况 ， 也 就 是 应 当 从 描述 统计 学 的 观点 出 发 
进行 分 析 的 情况 时 ， 分 析 过 程 只 需要 进行 第 @ 步 做 到 第 加 步 。 当然 如 果 必要 的 话 ， 
第 @ 步 也 是 要 进行 的 。 
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RA 标准 化 残 差 突 





实际 应 用 中 ， 我 们 还 会 遇 到 标准 化 残 差 这 一 概念 。 所 谓 标准 化 残 差 就 是 


标准 化 残 差 = 


残 差 平方 和 ~ S 
样本 个 数 -2 样本 个 数 -2 
下 表 中 记录 的 是 本 章 例子 中 的 标准 化 残 差 。 
令 表 2.1 ”本 章 例子 中 的 标准 化 残 差 





最 高 气温 | 冰 红 茶 的 冰 红茶 的 残 差 

CH) 销售 量 ( 杯 ) 销售 量 ( 杯 ) 
x y $=3.7x-364| yy- 了 
22 日 一) 29 77 72.0 5.0 
23 日 (二 ) 28 62 68.3 -63 
24 日 (三 ) 34 93 90.7 23 
25 日 (四 ) 31 84 79.5 4.5 
26 日 五 ) 25 59 57.1 19 
27H (8) 29 64 72.0 -8.0 
286 (H) 32 80 83.3 -3.3 
29 日 (一 ) 31 75 79.5 -4.5 
30H (=) 24 58 53.3 47 
31 日 三 ) 33 91 87.0 4.0 
1 日 (四 ) 25 51 57.1 -6.1 
2 日 五 ) 31 73 79.5 -65 
3 日 (六 ) 26 65 60.8 42 
4 日 (日 ) 30 84 75.8 8.2 














标准 化 残 差 
2 





-1.1 
0.4 
0.8 
0.3 

-1.4 


-0.6 


-0.8 
0.8 
0.7 

-11 

-1.1 
0.7 





标准 化 残 差 的 绝对 值 大 的 个 体 ， 被 看 成 与 其 他 的 个 体 性 质 不 同 。 当 绝对 值 大 于 
3 的 个 体 存在 时 ， 应 将 其 剔除 之 后 再 进行 回归 分 析 。 
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& 5. 内 插 法 和 外 插 法 只 





下 面 我 们 再 次 给 出 由 本 章 的 例子 所 推导 出 的 回归 方程 。 
OR22 “最 高 气温 ”和 “ 冰 红 茶 销售 量 " 











最 高 气温 | 冰 红茶 销 重 
(©) ( 杯 ) 
22 日 一 ) 29 77 
23 日 二 ) 28 62 
24 日 三) 34 93 
25 日 四 ) 31 84 
26 日 五 ) 25 59 
27 日 (AN) 29 64 
28 日 (日 ) 32 80 
29 日 一 ) 31 75 
30 日 (二 ) 24 58 
31 日 (三 ) 33 91 
1 日 四 ) 25 51 
2 日 五) 31 B 
3 日 (六 ) 26 65 
4 日 (日 ) 30 84 
了 = 3.7x 一 36.4 


冰 红 茶 销 量 ”最 高 气温 


从 上 表 中 可 以 看 出 ， 自 变量 “最 高 气温 ”的 最 小 值 是 24C, WAKE 34C. 

实际 应 用 中 ， 我 们 还 会 遇 到 内 插 和 外 插 的 概念 。 所 谓 的 内 插 ， 以 上 表 为 例 ， 就 
是 将 24 以 上 并 且 34% 以 下 的 值 代入 回归 方程， 进而 来 预测 冰 红 茶 的 销售 量 。 所 谓 
外 插 ， 以 上 表 为 例 ， 将 24%C 以 下 或 者 34 蕊 以 上 的 值 代 和 人 回归 方程 ， 进 而 来 预测 冰 红 
茶 的 销售 量 。 

在 使 用 外 插 法 时 ， 一 定 要 注意 以 下 情况 。 例 如 ， 在 预测 “最 高 气温 为 18C 时 冰 
红茶 销售 量 ” 的 时 候 ， 我 们 将 18 代入 回归 方程 中 的 x， 自 然 就 可 以 求 出 结果 。 预 测 
区 间 也 可 以 根据 第 92 页 的 计算 方法 求 出 结果 。 但 是 ， 这 些 值 和 区 间 是 否 可 信 ， 并 不 
能 够 从 数学 上 得 到 证 明 。 
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在 实际 操作 中 ,用 到 外 插 法 的 情况 也 不 少 。 对 笔者 本 人 来 说 ,只 要 不 是 学 术 研究 ， 
觉得 “也 许 无 需 这 么 较真 "， 那 么 使 用 外 插 法 也 是 可 以 的 。 话 虽 如 此 ,但 是 和 自 变量 
的 最 小 值 或 最 大 值 相差 太 远 的 值 ， 使 用 外 插 法 还 是 被 认为 不 太 可 靠 。 








& 6. 序列 相关 窜 





在 本 章 的 例子 中 ， 是 将 “最 高 气温 ”作为 自 变量 的 。 那 么 请 您 想 一 想 ， 某 天 的 
最 高 气温 是 30Y ， 而 第 二 天 突然 下 降 了 20Y ， 这 种 情况 似乎 不 大 可 能 。 通 常 ， 要 花 
上 几 天 的 时 间 ， 气 温 才能 渐渐 地 降下 去 或 者 升 上 来 ， 而 相应 的 因 变 量 “ 冰 红茶 的 销 
售 量 ” 也 只 能 渐渐 地 随 之 变化 。 

有 些 数据 会 随时 间 的 经 过 而 或 多 或 少 地 受到 影响 ， 对 这 类 数据 的 分 析 ， 我 们 称 
为 “序列 相关 "。 遇 到 这 样 的 问题 ， 最 好 先 确认 一 下 相 邻 残 差 之 间 的 关联 程度 。 有 时 
序列 相关 也 称 为 自 相 关 。 

通常 ， 我 们 使 用 Durbin-Watson 统计 量 作为 衡量 序列 相关 程度 的 指标 。 可 以 经 
过 以 下 计算 求 得 。 

相 邻 残 差 的 差 的 平方 之 和 
各 残 差 的 平方 之 和 
如 果 这 个 值 在 2 左右 ， 那 就 说 明 不 存在 序列 相关 ， 也 就 是 说 没 问题 。 
在 本 章 的 例子 中 ， 可 以 求 得 其 Durbin-Watson 统计 量 为 如 下 : 
(— 6.3 — 5.0)? + [2.3 — (— 6.3)? + +++ + (8.2 — 4.2) ain 
5.0? + (— 6.3)? + +++ + 8.2? ‘ 
这 个 值 接近 2， 所 以 可 以 说 不 存在 序列 相关 。 


Durbin-Watson 统计 量 = 








& 7. 直线 以 外 的 回归 方程 & 





在 第 60 页 中 ， 





所 谓 回归 分 析 ， 就 是 求 出 被 称 为 回归 方程 的 


y=ax+b 


的 一 种 分 析 方法 。 





需要 说 明 一 点 。 实 际 上 ,所 求 的 回归 方程 并 不 一 定 是 >=ax+b 这 样 的 直线 ”, 例 如 
还 有 如 下 形式 : 


“= 全 +b 


+y=a\¥+b 


+ y=ax+bx+e 
+ y=alogx+b 


以 上 这 些 形式 都 是 可 以 的 。 实 际 上 ， 第 26 页 出 现 的 美 羽 “ 年 龄 ”和 “身高 ”的 
回归 方程 ， 并 不 是 y=ax+b Est, WL y= +b 的 形式 。 


应 当 使 用 哪 种 函数 类 型 来 求解 回归 方程 。 这 要 根据 分 析 者 自己 的 判断 进行 选择 。 
基本 上 ， 按 照 以 下 的 顺序 进行 判断 较为 合理 。 


© 画 出 自 变量 和 因 变 量 的 散 点 图 。 
@ 使 用 和 散 点 图 形式 相近 的 函数 类 型 求解 回归 方程 ， 例 如 在 第 26 页 的 例子 中 


yo Hb 和 py=aFHb 都 符合 ， 那 就 两 个 都 用 ， 将 能 求 出 来 的 都 求 出 来 。 


© 在 第 @ 步 所 求解 的 回归 方程 当中 ， 判 定 系数 的 值 较 大 的 那个 就 是 我 们 所 要 求 的 回 
归 方程 。 
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第 26 页 中 出 现 的 美 羽 的 “年 龄 ”和 “身高 ”的 回归 方程 ，>= -2266+ 1733 


是 如 何 求 出 来 的 呢 ? 下 面 给 出 计算 过 程 。 


国美 羽 “年 龄 ”和 “身高 ”的 回归 方程 的 求解 方法 


a les 
yay th eyaKx 


y=S+b=aXtb 


这 样 就 可 以 将 其 改写 成 “直线 ”的 形式 。 


正如 第 70 页 说 明 的 那样 ， 回 归 方程 y=aX+b 中 ，a 和 45 的 值 可 以 通过 以 下 计算 
求 得 。 


a= 


Su 





和 " 
| TOON ee 


b=5- Xa = 138.2625 - 0.1072 x (— 326.6)= 173.3 


因此 ， 回 归 方 程 为 : y =- 326.6x + 173.3 于 是 ?= -2266+ 173.3 


i} tT 1 
身高 1 身高 ”年龄 





È 
3 


ee 
党 这 里 所 写 的 计算 值 不 应 是 -326.6， 而 应 是 所 求 得 的 -326.3。 这 是 由 于 四 会 五 人 而 产生 的 误差。 
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OR23 a 和 b 的 计算 过 程 


AK | yy |æ] (pp |o 





0.1428 | —38.1625 | 0.0204 |1456.3764| 一 5.4515 
0.0928 | —31.0625 | 0.0086 | 964.8789| —2.8841 
0.0595 | —24.1625 | 0.0035 | 583.8264| —1.4381 
0.0357 | —16.5625 | 0.0013 | 274.3164| 一 0.5914 
0.0178 | —11.4625 | 0.0003 | 131.3889| —0.2046 
0.0040| 一 7.3625 | 0.0000| 54.2064| 一 0.0292 
一 0.0072| 一 0.7625 | 0.0001 0.5814 0.0055 
—0.0162 4.9375 | 0.0003 | 24.3789] —0.0802 
一 0.0238| 11.1375] 0.0006 | 124.0439 —0.2653 
一 0.0302| 13.3375 | 0.0009 | 177.8889] —0.4032 
—0.0357| 15.7375] 0.0013 | 247.6689 一 0.5622 
一 0.0405| 16.3375 | 0.0016 | 266.9139 —0.6614 
一 0.0447| 16.7375 | 0.0020 | 280.1439] —0.7473 
—0.0483| 16.8375 | 0.0023 | 283.5014 —0.8137 
—0.0516] 17.0375 | 0.0027 | 290.2764 —0.8790 
—0.0545 17.4375 | 0.0030 | 304.0664] —0.9507 
0.0000] 0.0000 0.0489 |5464.4575| 



































总 计 5.9563 
= J J J 
Sm Sy Sy 
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第 3 章 4 
重 回归 分 析 


D2 a 


本 章 中 关于 “ 重 回归 分 析 中 的 预测 区 间 ” 的 相关 内 容 已 经 传送 到 网 站 
http://www.okbook.com.cn， 名 为 “ 重 回归 分 析 中 的 预测 区 间 ” 的 文 
件 夹 中 ， 请 您 下 载 参考 。 





WY ithe Y 
Se ae ED 
S 
a J 
á A 
ne 











没关系 | 
反正 没 等 
多 久 。 

















今天 我 们 要 讲 “ 重 回归 
分 析 "， 所 用 的 分 析 材 料 
RARE 带 给 我 们 的 。 


D) 


AM, PEER, 


初 ， 





宫 野 ， 这 个 称呼 
KARTE! 
k, RERFH | 
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重 回归 分 析 就 是 通过 
多 个 因素 进行 预测 的 


和 
方程 很 相似 啊 ! 


重 回归 分 析 ， 可 以 
理解 成 “有 2 个 以 
上 自 变量 的 回归 分 


重 回归 方程 


=QX + AzXz+ > 


自 变量 





所 求 的 回归 方程 也 
相应 地 变 成 “ 重 回 
归 方 程 ”! 


+ Qp%p +b 


MAL 
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那么 ， 分 析 的 流程 
也 和 回归 分 析 很 相 


ALEC 


@D 首先 ， 为 了 讨论 是 否 具 有 求解 重 回归 方程 的 意义 ， 画 出 各 个 自 变量 和 
因 变 量 的 散 点 图 。 

本- 

ee 

ee “ 重 回归 系数 的 检验 ”。 

s 总 体 回归 Aix tdaxs te +A,x, 的 估计 。 

ea. 


这 就 是 重 回归 
分 析 的 过 程 。 
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| 为 了 讨论 是 否 具 有 求解 重 回归 方程 的 意义 ， 画 出 各 个 自 变量 和 


因 变 量 的 散 点 图 





那 就 赶快 开始 
DM | 


梦 之 丘 总 店 
寺 井 站 大 厦 店 
曾 根 店 
桥 本 大 街 店 
桔梗 町 店 
邮政 局 前 店 
水 道 町 站 前 店 
六 条 站 大 厦 店 
若 叶 川 店 
美里 店 





首先 ， 我 们 来 看 一 下 
现 有 店铺 的 数据 。 


是 高 最 近 的 车 站 Ai 
Gia) Spl 《万 日 元 ) 








80 
0 
200 
200 
300 
230 
40 
0 











党 坪 ， 日 本 面积 单位 名 ，1 坪 约 为 3.305785m2。 


“月 营业 人 额 ”是 因 变 量 ， 
其 他 的 是 自 变量 是 这 
样 吧 ? 
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AMER 40 * A uM RES ee: 40 * AR" 


MIRAR =0.8924 19% 4M =-0.7751 
LERE Ey ML ESS 


Ped ie ARIK 
es 褒 
R PRAMA . URA 


KUT Be e 
EETAS T KAn ARA 
WRENS 
otimo 


RERA 
eset . mt 
soit id “nins gwa 





makaa RIA 








D w 150 æ Ææ w 3 
距 最 近 在 站 的 距离 


看 起 来 ， 店 铺面 积 越 大 ， 具有 求解 重 回归 
距 最 近 的 车 站 越 近 ， 月 方程 的 意义 啊 
营业 额 就 越 高 | 
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© 求解 重 回归 方程 





š s 使 用 “最 小 二 乘法 " 
ee os 对 偏 回归 系数 进行 
方程 时 几乎 是 一 样 的 。 3 AA 求解。 


那 我 就 粗略 地 
Ee ea 


Rk, XPa, ar 和 bb 求 微分 ， 令 微分 
值 为 0， 再 求 出 令 5S。 的 值 最 小 时 的 a, 


a (ane +@2x80+b)} 
+{366-(Q1x8+Q2x 0+b)?™ = HO MEG ay 
iw aha ey ed 


ties 
3 2 |h -xst aniortrsoe | 
+ P44- (Qi 9+ axl +b) | as ANT cee bo 












在 这 里 我 们 使 用 
拭 阵 进行 计算 1 || 这 里 的 …… 






10 80 r 

BO i 

8 201 
88 5787969 rath 088 5 
80 0 20 200 300 230 40 0 330 (8 80 0 W0 200 
fosa 1 1 ! ‘en | JENIE 1 

9 4 | 

9 0 

6 Bo! 

9 180 1 


用 这 样 的 计算 pr 


就 能 求 出 来 路! (eo 
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J 
| 


i er ae 


为 了 便 子 计算 ， 在 求解 
重 回归 方程 的 时 候 ， 必 











i 


RG FPG AY 1, 


各 个 数值 代表 的 
意义 是 这 样 的 。 





£F 
= 
fug 
eK 
wi 
* o. 
te 


E 
4 
w 


明白 了 ， 不 过 我 能 


数值 的 意思 ， 我 是 
算出 来 吗 …… 

















AF ikk | 自 变量 偏 回归 系数 
店铺 面积 a 415 
pre =) 距 最 近 车 站 的 距离 a -0.3 

> 常数 项 b 653 哈哈 1 























Gah) 52%,- 0322+ 65.3 
1 t iG 


ABUR AMER WREG 
站 的 距 


风 见 面包 上 店 的 
重 回归 方程 就 


虽然 和 求解 重 回归 方程 
没有 直接 关系 但 是 因为 
它 很 重要 ， 所 以 要 事先 
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Ge, 


尝 求 解 方法 见 
第 205 页 














在 重 回 归 方 程 y=awxrtaseyt…tamptb P, 
Ea, ay a DBA AM, MEMS 
(i, Ho, Xe, F) AH, HA HP 









也 就 是 说 ， 这 个 y=41,5x1 一 0,3x2+65.3 是 与 “店铺 面积 ”的 平均 值 、" 距 最 近 车 站 的 距离 ”的 


平均 值 、“ 月 营业 额 ”的 平均 值 机 对 应 的 | 
a 
ey 
Js PS 
















所 谓 的 精度 ， 是 不 是 
pe ee 和 回归 分 析 一 样 也 存 
f BEM AM FoF 





KAA y Fo HM I 05H AK AMAA MK ABR, 
将 其 平方 之 后 就 得 到 判定 系数 R, 


梦 之 丘 总 店 18823.8 | 14735.1 | 16654.4 
寺 间 站 大 厦 店 1169.6 | 4307.5 2244.6 
曾 根 店 1536.6 65 -99.8 
桥 本 大 街 店 15326.4 | 16150.7 | ”15733.2 
桔梗 叮 店 7361.6| 6106.9 | — 6705.0 
邮政 局 前 店 1211.0| 163.1 444.4 
水 道 町 站 前 店 973.4| 109.9 327.1 
六 条 站 大 厦 店 10857.6 | 11480.1 | 11164.5 
若 叶 川 店 17902.4 | 16870.5 | 17378.8 
美里 店 1036.8 | 2096.4 1474.3 
7619.6 | 712026.6 | 72026.6 
































4 


S S» 


Se 在 计算 重 相关 系数 尺 
时 ， 虽 然 不 会 涉及 ， 但 
是 对 之 后 的 运算 很 重要 ， 
所 以 要 先 求 出 来 。 


重 相关 系数 R 是 
y 和 的 离 差 积 和 Sy 


R= = 
/的 离 差 平方 和 x 的 离 差 平方 和 VS x Se 








72026.6 
x 72026.6 
判定 系数 惨 是 


R° = (0.9722) = 0.9452 NEARE /| 
0.9452 | 


= 0.9722 
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FIR ABR 的 取 值 
范围 ， 还 是 从 0 到 


没 错 。 重 回归 方程 的 精 
度 越 高 就 越 接近 l, E 
则 的 话 ， 就 越 接近 0, 


A y b- 
还 是 和 回归 方程 一 样 那 这 个 重 回归 方程 的 
没有 衡量 标准 吗 ? 


是 的 ， 不 过 还 是 以 “0.5 
以 上 ”作为 标准 吧 ! 


顺便 说 一 下 ， 虽 然 这 里 省 略 了 证 明 过 程 ， 但 是 


ARAM = nagg = au tO t t aS EE 
5 


yy 





这 样 的 关系 还 是 成 立 的 。 





村 2, MAHZ 
AER? 










ig 
4 会 变 得 越 大 上 
Pro Oe 


例如 , 现在 我 们 将 数据 中 加 入 “ 店 
长 年 龄 " 这 一 项 来 看 看 。 不 加 的 时 候 ， 判 定 系数 
的 值 是 0.9452， 


梦 之 丘 总 店 
寺 井 站 大 厦 店 
曾 根 店 
桥 本 大 街 店 


桔梗 町 店 


邮政 局 前 店 
水 道 町 站 前 店 
六 条 站 大 厦 店 
著 叶 川 店 
美里 店 
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aay |R EE OM 
RGH RETA 








BAA 





ER 
aR | 





= R=0.9495 = 


ERT 0.9495 | 


> 


R= 0.945 





“BR foe wag | 


是 完全 没有 关系 的 | 


RP tos, ARKH 
的 值 还 是 变 大 了 














修正 自由 度 的 判定 系数 的 值 可 以 通过 以 下 计算 
解 出 来 ! 
| 那么 ， 美 羽 你 来 求 一 下 ， 不 
: | 


加 “ 店 长 年 龄 ”和 加 了 以 后 
两 种 情况 下 ， 修 正 自由 度 的 


样本 个 数 一 自 变量 个 数 一 1 ARERR | 

















O 只 有 “店铺 面积 ”和 “ 距 最 折 东 站 的 距离 ”的 情况 
首先 , 是 只 有 “店铺 面积 ” 
和 “ 距 最 近 丰 站 的 距离 + NRE ZO, 9452 
情况 
+ GEOPRWNEARR? RZ 


AN 
mae) 
( reve ee ) 
(9 ) 
fo T a 


(142 6 ) 


losl 
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变 成 0.9296 了 。 
那么 ， 接 下 来 是 “店铺 面 Kit, Pa RAIA 
积 、“ 距 最 近 车 站 的 距离 ” : 


已 经 求 出 判定 系 
RR BRE AER sane 





对 了 ， 


是 0.9495 | | 























那么 ， 只 需要 求 出 修正 a 哎呀 ， 这 种 情况 下 的 Sn 和 
自由 度 的 判定 系数 的 值 /| | ~ Se 是 什么 样 的 呢 ? 


Sy 同 只 考虑 “店铺 面积 " 
和 “ 距 最 近 夺 站 的 距离 
时 一 样 。 


O 店 钳 画 积 *、" 距 最 折 本 站 的 距离 ， 以 及 “ 店 长 年 只 
5. 的 计算 有 些 复杂 
PORE EA BR wa avian. 


+ NEBR’ ZB 0.9495 
“修正 自由 度 的 判定 系 客 内"? R 


( Ne 
ie RATE - BERT 


( tere) 
( S846 .4 ) 
“(uaa ty 0.9243 


(0-/ 


=/- 
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0 pf 
EMDR |“ 店铺 面积 "和 
“ 距 最 折 丰 站 的 “| “ 距 最 近东 站 的 距离 > 
距离 “让 长 年 龄 ” ae 
修正 自由 度 的 判定 系数 qe 










R*? 的 值 在 不 加 “ 店 长 
年 龄 ”的 情况 中 下 会 比 
BRKT! 











| 
R| onL OME An a 
R™|\( 0.9296 P 09243) = 
“uy anan ow a 









怎么 样 ? 同 R 相 比 ， 还 
AR? HMR TMA 
ve! 













mkh, DAOP, MAZAR 
R mw, PEAGRHNRAKR*? 
的 值 都 变 小 了 呀 ! 























“店铺 面积 “店铺 面积 ”和 
“WRG sey | “emia whee” 
kA “BREE. 
RÈ | 10.9452 | (0.9495 
一 一 -一 
R® 0.9296 | 0.9243, 







所 以 在 确认 重 回归 方程 的 精 
h, AMRAH R”? 的 
值 ， 进 行 判断 就 可 以 了 | 
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是 “回归 系数 的 检验 ”和 
总 体 回 归 的 估计 吗 ? 





重 回归 分 析 也 是 
需要 推测 总 体 情 
况 的 。 






你 还 记得 做 完 回 
归 分 析 之 后 所 讲 
的 那个 前 提 吗 ? 





一 定 成 立 的 假设 。 








“店铺 面积 为 x FE, 

VERS HSER A xm 时 

ASUR" 服从 

平均 值 为 人 ixa+ 人 sxa+B， 标 准 郑 为 o 的 








Db f 只 有 确信 这 个 假设 一 
D A 定 成 立 之 后 ， 才 能 进 
i 行 分 析 | 
N 


@ 进行 “回归 系数 的 检验 ” 


所 求 出 的 重 回归 方程 





证 明 过 程 就 不 讲 了 ， 不 过 ， 


HSA, AZ, B, o, 可 =AAit+QaAztb 
是 统计 学 中 常常 会 用 到 的 ， IE TGAN 
Bh 





重 回归 方程 为 
了 = 41.5xi- 0.3x24 65.3 


“NAA 41.5 
“AWA -0.3 
‘BARN 65.3 


-o WA 1 oes = 24.4 
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就 和 回归 分 析 有 差别 了 ， 


以 ，“ 重 回归 系数 的 
所 包括 两 种 类 型 : 


检验 "， 









































A= 人 = 二 0 不成立。 

即 ， 下 面 任意 一 组 关系 成 立 : 
A, #OR A #0 

A. #08 A= 0 


A=08 A #0 


这 样 的 话 ， 以 0.05 
为 有 意义 的 标准 ， 
分 别 做 做 两 种 检验 
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将 “店铺 面积 x 坪 、 距 最 近 车 站 的 距离 xzm 的 店铺 ” 
作为 总 体 。 





原 假设 为 “41=42=0 成 立 "。 
备 择 假设 为 “41=4=0 不 成 立 "。 





选择 所 要 进行 的 “检验 ” 类 型 4 进行 “全 面 讨论 偏 回 归 系数 的 检验 ”。 





4 | 设 定 有 意义 的 标准 。 


以 0.05 为 有 意义 的 标准 。 





下 面 进行 “全 面 讨论 偏 回归 系数 的 检验 "“ 全 面 讨论 偏 回归 
系数 的 检验 ”的 检验 统计 量 为 
Sy- Se Se 
自 变量 的 个 数 PENA 
所 以 在 本 例题 中 的 检验 统计 量 的 值 为 


76199.6 一 4173.0 4173.0 
2 10-2-1 





= 60.4 


在 本 例题 中 ， 如 果 原 假设 成 立 ， 那 么 检验 统计 量 就 服从 第 
1 自由 度 为 2 (= 自 变量 的 个 数 )、 第 2 自由 度 为 7 ( = 样本 
个 数 一 自 变量 个 数 一 2 ) 的 严 分 布 。 





| Fame 5S 中 下 出 的 检验 统计 | 


中 量 的 值 所 对 应 的 己 值 ， 与 有 意 
的 标准 进行 比较 , 看 看 P 值 
否 比 其 小 。 


有 意义 的 标准 是 0.05。 检 验 统计 量 的 值 为 60.4， 所 以 P 值 
为 0.00004。 
0.00004<0.05， 所 以 尸 值 小 。 





如 果 在 步骤 6 中 己 值 比 有 意义 

标准 小 ， 则 我 们 就 可 以 得 出 
“ 备 择 假设 成 立 ”的 结论 。 反 
之 ， 我 们 就 可 以 得 出 “ 原 假设 
并 没有 错 ” 的 结论 。 
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与 有 意义 的 标准 相 比 , P 值 小 。 所 以 , 备 择 假设 “不成立 ”， 
假设 “41=42=0” 成 立 。 








接 下 来 ， 进 行 “ 分 别 讨论 偏 回归 系数 的 检验 ”! 
BAN A 为 检验 对 象 ， 来 示范 一 下 ! 





定义 总 体 。 


将 “店铺 面积 x 坪 、 距 最 近 车 站 的 距离 zzm 的 店铺 ”作为 
总 体 。 





建立 原 假设 和 备 择 假设 。 


原 假设 为 “41 = 0 成 立 "。 
备 择 假 设 为 “41 #0 成 立 ”。 





选择 所 要 进行 的 “检验 ”类 型 


进行 “分 别 讨论 偏 回 归 系 数 的 检验 ”。 





设 定 有 意义 的 标准 。 


”| 以 0.05 为 有 意义 的 标准 。 





通过 样本 数据 求 出 检验 统计 量 
的 值 。 


下 面 进行 “分 别 讨论 偏 回归 系数 的 检验 ”的 过 程 。 
“分 别 讨论 偏 回归 系数 的 检验 ”的 检验 统计 量 为 


aj S. 
SAA 秤 本 不 数 - 自 变 量 的 个 数 -1 
所 以 在 本 例题 中 的 检验 统计 量 的 值 为 
AARTE P 
在 本 例题 中 ， 如 果 原 假设 成 立 ， 那 么 检验 统计 量 就 服从 第 1 
自由 度 为 1、 第 2 自由 度 为 7 ( = 样本 个 数 一 自 变量 个 数 一 2 ) 
的 严 分 布 。 





PERDR 5 中 求 出 的 检验 统计 
量 的 值 所 对 应 的 尸 值 ， 与 有 意 
义 的 标准 进行 比较 ,看 看 P 值 
是 否 比 其 小 。 


有 意义 的 标准 是 005。 检 验 统计 量 的 值 为 44.0， 所 以 己 值 
为 0.0003。0.0003<0.05， 所 以 值 小 。 





0 果 在 步骤 6 中 己 值 比 有 意义 
的 标准 小 ， 则 我 们 就 可 以 得 出 
“ 备 择 假设 成 立 ”的 结论 。 反 

， 我 们 就 可 以 得 出 “ 原 假设 





与 有 意义 的 标准 相 比 ,P 值 小 。 所 以 , 备 择 假设 “4 0 "成 立 。 


AE Su 的 求解 方法 见 下 页 说 明 。 





但 是 ,不管 步骤 7 的 结论 是 什么 ， 我 们 还 是 习惯 性 地 认为 
“只 有 在 检验 统计 量 
Cr Ss. 
SREP REEE 的 入 大 于 2 的 情况 下 ， 
这 个 偏 回 归 系数 所 对 应 自 变量 才 对 因 变 量 的 预测 有 意义 。” 





4 
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这 是 步骤 5 中 出 现 的 “S'。 


























有 些 参考 资料 中 ， 并 不 是 依据 上 分 布 ， 而 是 依 
据 t 分 布 来 讲解 “ 偏 回归 系 数 的 检验 ”的 。 

这 个 问题 从 数学 的 角度 解释 起 来 比较 困难 ， 所 
以 我 们 不 做 详细 介绍 。 但 是 ,无 论 依据 哪 种 分 布 ， 
其 最 终 的 结论 都 是 相同 的 。 
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© 总 体 回归 Aix + 4zxz+…+Aoxs+B 的 估计 




















接 下 来 应 该 是 …… 
i é 也 是 同 回归 分 析 一 样 ， 
AARET j | j 都 要 解 出 “置信 区 间 ” 
? €? 


























重 回归 分 析 中 的 计算 ， 
才 是 真 的 让 人 抓 狂 呢 ! 


虽然 和 回归 分 析 大 致 相 
同 ， 但 是 计算 过 程 中 会 
RA DRIER” 

那 可 是 个 大 麻烦 啊 | 


如 果 可 以 的 话 ， © 
我 们 在 这 合 住 
一 起 努力 吧 ? 
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Vii 


那 现 在 ， 我 们 就 用 数据 
分 析 软 件 来 求 置 信 区 间 
we! 


RRETH, 不 过 
我 们 也 不 能 偷懒 。 
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那么 ， 就 试 着 求 一 下 总 体 回 归 
AX 10+A2 x 80+B 的 置信 区 间 
吧 ! 


总 体 回归 A X10+42X80+B AR 
信 度 是 9596 的 情况 下 ， 应 该 处 于 
418.3 万 日 元 以 上 488.1 万 日 元 以 
下 ， 是 这 样 吧 ? 





On 测 


这 个 就 是 现在 要 开 的 
店铺 的 数据 。 








Ge 45x -0.3 Xz + 65. 3 
= 4l.5x10 ~ 0.3 x l10 +65.3 


啊 ， 这 么 说 ， 重 回归 分 析 做 回归 分 析 的 时 候 ， 置 信 区 间 和 预测 区 


间 的 求解 方法 是 很 币 似 的 。 那 重 回归 分 
也 要 像 回归 分 煌 那样 求解 
出 “预测 区 间 "， 是 吗 ? TERES 
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TA, MA “A 
马 …” 是 什么 呢 ? 









HM, LAURE ` 
软件 计算 的 吧 | [F 
KS \ (Se A 
od ram CE 


375.1 以 上 ， 
oo LI 510.9 以 下 。 


太 谢谢 你 们 两 个 了 ， 
为 我 提供 了 参考 | 

? 人 
) HRS 





最 后 作为 赠品 ， 再 介 
绍 一 种 更 好 的 求解 重 
回归 方程 的 方法 。 


如 果 是 那样 的 话 
为 什么 最 开始 不 ….， RA 


‘ " 但 是 ， 自 变量 越 多 
像 刚刚 “ 店 长 年 龄 ”这 样 的 但 是 ， 
和 因 变 量 不 相关 的 自 变量 计算 过 程 不 就 会 越 
也 是 存在 的 。 


重 回 归 分 析 也 和 回归 分 析 
一 样 ， 无 论 什 么 数据 ， 都 
是 通过 数学 的 方法 求解 基 
本 重 回归 方程 的 。 
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E GFAK +A Tt Tt t Qs as ite esi 


考虑 到 以 上 情况 ， 对 于 £8: Y= AiXitQ2%2tb 

分 析 者 来 说 “更 好 的 

重 回归 方程 ”可 以 说 是 精度 高 REE 
“ 自 变量 个 数 不 多 、 并 so GANtAA tb YA A+QN+b T 
且 精 度 又 高 的 重 回归 Se Rt > Re CEY 
方程"。 











这 种 “ 自 变量 个 数 不 多 、 并 且 精 度 高 的 


今天 我 就 来 讲 一 种 比 这 些 方法 都 简洁 


重 回归 方程 ”的 求解 方法 是 易 懂 的 方法 一 一 “最 优 子 全 法 "。 


”变量 增加 法 
”变量 减少 法 
”变量 增 减 法 
”基于 “情报 量 标准 ”的 


方法 
Aa ANRER, 来 求解 
重 回归 方程 


Xi "之 ,和 Xz * Xi 和 Xz2 和 Xs 
+ Xi 和 Xs 











例如 ， 如 果 我 们 用 
Xi X2, a 作为 备 选 









那 就 用 “最 优 子 
集 法 ”具体 分 析 
一 下 吧 ! 








修正 自由 度 的 

HERUR? 
0.7709 
0.5508 
0.0000 




















Aene 
WA T E po 

> POO ene 
i 组 合 后 的 重 回归 方程 





度 最 高 ， 
或 应 该 是 这 个 ! 
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3. 重 回 归 分 析 过 程 中 的 注意 事项 w 





下 图 中 ,我 们 再 次 给 出 106 页 中 出 现 的 重 回归 分 析 的 过 程 。 


DHE, 为 了 讨论 是 否 具有 求解 回归 方程 的 意义 ， 画 出 各 自 变量 和 因 变 量 的 
散 点 图 。 

l 

回 求解 重 回归 方程 。 

l 

@ 确认 重 回归 方程 的 精度 。 

+ 

@ 进行 “ 偏 回 归 系 数 的 检验 ”。 

ty 

图 总 体 回归 Axi tara to +A +B 的 估计 。 

$ 

© 预测 。 


















图 3.1 重 回归 分 析 的 过 程 
此 前 ， 在 我 们 的 讲解 中 ， 必 须 完成 上 图 中 的 第 @D 步 到 第 @ 步 。 但 事实 并 非 如 此 。 
同 回归 分 析 一 样 ， 不 同 的 情况 下 ， 只 完成 第 @ 步 到 第 @) 步 亦 可 。 

但 是 在 本 章 中 提 到 的 风 见 面包 店 只 有 10 个 店铺 而 已 ， 而 且 举 例 中 所 用 的 店铺 面 
积 为 10 坪 \ 距 最 近 车 站 距离 为 80m 的 店铺 ,也 只 有 “ 梦 之 丘 总 店 ” 这 一 家 。 这 样 一 来 ， 
在 估计 总 体 回归 A, x 10+4, x 80+8， 或 是 在 进行 “ 偏 回归 系数 检验 ”时 ， 就 可 能 会 
使 读者 产生 疑问 了 。 这 也 是 情 有 可 原 的 。 实 际 上 ， 理 纱 是 在 如 下 解释 的 基础 上 进行 
分 析 的 。 








“店铺 面积 为 10 坪 、 距 最 近 车 站 距离 为 80m” 一 一 像 这 样 的 店铺 ， 风 见 面包 店 
今后 还 会 开设 很 多 。 这 次 只 不 过 是 从 这 样 的 店铺 群 中 ， 随机 抽取 到 “ 梦 之 丘 总 店 "而 已 。 








对 于 理 纱 的 解释 可 以 说 还 是 有 值得 商检 的 地 方 。 笔者 认为 这 是 一 个 比较 牵强 的 
解释 。 严格 地 说 ,如 果 我 们 考虑 到 风 见 面包 店 的 人 气 问题 ,那么 就 可 以 说 它 是 一 个 “4E 
常 没 有 根据 的 解释 "。 既 然 如 此 ,是 否 还 需要 专门 进行 总 体 回 归 的 估计 或 是 “检验 " 呢 ? 
笔者 认为 ， 还 是 要 从 记述 统计 学 的 角度 进行 分 析 ， 判 断 是 否 需要 。 
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RA RIEL IR 








同 回归 分 析 一 样 ， 这 里 也 有 必要 对 重 回归 分 析 的 标准 化 残 差 进行 讨论 。 重 回归 
分 析 的 标准 化 残 差 为 
































残 差 i JED. 
残 差 平方 和 | Se 
VERTE- AEE 样本 个 数 - 自 变量 个 数 -1 
下 表 中 记录 的 是 本 章 例子 中 的 标准 化 残 差 。 
OR3.1 ”本 章 例子 中 的 标准 化 残 差 
标准 化 残 差 
par tee 月 营业 额 月 营业 额 RŽ 
|> E E =41.5xı —0.3x+65.3| y- 
梦 之 丘 总 店 | 10 80 469 453.2 | 158 0.6 
HIWA 8 0 366 397.4 -31.4 -1.3 
曾 根 店 | 8 200 371 329.3 41.7 17 
桥 本 大 街 店 5 200 208 204.7 33 0.1 
桔梗 叮 店 7 300 246 253.7 -7.7 -0.3 
邮政 局 前 店 | 8 230 297 319.0 -22.0 -0.9 
水 道 町 站 前 店 7 40 363 342.3 20.7 08 
六 条 站 大 厦 店 9 0 436 438.9 -2.9 -0.1 
若 叶 川 店 6 330 198 201.9 -3.9 -0.2 
美里 店 | 9 180 364 377.6 -13.6 -0.6 
Oe ey 


1 


标准 化 残 差 的 绝对 值 大 的 个 体 ， 被 看 成 与 其 他 的 个 体 性 质 不 同 。 当 绝 对 值 大 于 
3 的 个 体 存在 时 ， 将 其 剔除 之 后 ， 再 进行 重 回归 分 析 。 
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帘 5. 马 氏 距 离 以 及 重 回归 分 析 中 的 置信 区 间 和 预测 区 间 窜 





如 127 页 和 131 页 所 述 ， 在 计算 重 回归 分 析 的 置信 区 间 和 预测 区 间 的 过 程 中 ， 
出 现 了 所 谓 的 马 氏 距离 (Mahalanobis Distance )。 这 与 我 们 在 初中 和 高 中 学 过 的 普通 
距离 一 一 欧 氏 距离 ( Euclidean Distance) 有 所 不 同 ， 是 一 种 重新 定义 的 距离 概念 。 

读者 可 能 会 问 “ 为 什么 要 专门 定义 出 这 样 一 种 距离 呢 ? ”对 于 这 个 问题 ,笔者 
本 想 进行 回答 ， 但 是 由 于 篇 幅 所 限 ， 并 且 与 本 书 的 写作 主旨 没有 太 大 关系 ， 所 以 只 
好 点 到 即 止 。 但 是 ， 稍 后 会 讲解 其 计算 方法 。 可 是 不 管 怎样 ， 马 氏 距 离 在 统计 学 中 
是 赫赫 有 名 的 ， 所 以 无 论 何 时 都 请 记 住 它 。 顺 便 提 一 下 ， 马 氏 “Mahalanobis” 是 数 
学 家 Prasanta Chandra Mahalanobis 的 名 字 。 

接 下 来 ， 我 们 讨论 本 节 的 主题 。 重 回归 分 析 的 置信 区 间 的 求解 顺序 如 下 所 述 。 
为 了 方便 起 见 ， 我 们 仍然 使 用 第 129 页 提 到 的 “ 梦 之 丘 总 店 ”的 例子 ， 讲 解 其 置信 


区 间 的 求解 过 程 。 
Sy Sait Sy Su Su … Sy 外 
elo rs een PS ae ee 
Sa Sq ee Sy Sa Sat Sp) (9 go gm 


GAN, ERR “Sn” RR “OR 2 个 自 变量 的 离 差 平方 和 ”，“ 5,s” 就 表示 “第 
2 个 自 变 量 和 第 5 个 自 变量 的 离 差 积 和 ”， 不 难 理解 它 与 “Ss, ”是 相等 的 。 
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这 里 所 求 得 的 SY 和 5* 的 值 同 第 126 页 出 现 的 值 是 相同 的 。 同 时 不 仅 限于 此 例 ， 


Sa Sa Sy 
Sa Sa *** Sy 


~ S| 中 se 和 so 的 值 
Sn Sa h Sy 
“SPHERE” PARAMS HEL, 
都 一 定 是 相同 的 。 


求 “ 马 氏 距 离 的 平方 "。 
D = [fx -E(x — FS" + (0 = E) 0a -BS ++ Bs, HS” 
Ha =) — EDS” + (n — HN — HS” 400+ (4, = N- F)” 








H=) = HS" + (&, = FN — FS” + 二 (Hx, = ENC, 一 元)S”]( 样 本 个 数 -1) 
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求 置信 区 间 
置信 区 间 


a,x 10-44, x80 +5 453 +35 
= 415 x 10 — 0.3 x80 + 65.3 = 488 
= 453 








在 求解 预测 区 间 的 时 候 ， 同 回归 分 析 一 样 ， 区 间 宽 度 不 是 














当 置 信 度 是 99% 的 时 候 ， 只 需 将 


F (1, 样本 个 数 — 自 变量 个 数 - 1;0.05)= F (1,10 -2 _ 1;0.05)= 5.6 这 一 部 分 ， 
替换 为 


F (1, 样本 个 数 - 自 变 量 个 数 - 1;0.01) = F (1,10 ~ 2 — 1;0.01)= 12.2 就 可 以 了 。 
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| & 6. 自 变量 为 分 类 数据 时 的 重 回归 分 析 & 





下 面 ， 我 们 再 次 给 出 第 107 页 出 现 的 表格 。 
OR32 第 107 页 出 现 的 表 








店铺 面积 距 最 近 车 站 距离 月 营业 额 

( 坪 ) (m) (万 日 元 ) 
梦 之 丘 总 店 10 80 469 
寺 井 站 大 厦 店 8 0 366 
曾 根 店 8 200 371 
桥 本 大 街 店 4 200 208 
桔梗 町 店 7 300 246 
邮政 局 前 店 8 230 297 
水 道 町 站 前 店 7 40 363 
六 条 站 大 厦 店 9 0 436 
车 叶 川 店 6 330 198 
美里 店 9 180 364 











< 
由 上 表 可 知 ， 作 为 自 变量 的 “店铺 面积 ”和 “ 距 最 近 车 站 的 距离 ”以 及 作为 因 


变量 的 “月 营业 人 额 ”都 是 数值 数据 。 

在 重 回归 分 析 中 ， 因 变量 必须 为 可 测 变量 ， 而 自 变量 则 可 以 是 

+ 仅 为 数值 数据 

“数值 数据 和 分 类 数据 的 混合 

“ 仅 为 分 类 数据 

这 三 种 之 一 。 

下 面 我 们 举 两 个 数值 数据 和 分 类 数据 混合 时 的 例子 ， 和 一 个 仅 为 分 类 数据 的 例 
子 。 
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图 数值 数据 和 分 类 数据 混合 时 的 例子 <1> 


店铺 面积 | 距 最 近 车 站 easy | PELA 
地 ) 距离 m) | 


一 全 一 上 一 一 
梦 之 丘 总 店 80 


寺 井 站 大 厦 店 0 
曾 根 店 200 

桥 本 大 街 店 200 
桔梗 叮 店 300 
邮政 局 前 店 230 
水 道 叮 站 前 店 40 
六 条 站 大 厦 店 0 
若 叶 川 店 330 
美里 店 180 


a 
Zo 
2 
ct 





| 


0 469 
366 
0 371 
1 208 
1 246 
1 
1 
0 
1 
0 


Ss 


297 
363 
436 
198 
364 


Oa Onon YD o o 
-eoH ccc oH om 




















那么 ,通过 对 以 上 数据 的 分 析 ， 我 们 可 以 求 出 其 重 回归 方程 为 : 
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图 数值 数据 和 分 类 数据 混合 时 的 例子 <2> 





店铺 面积 | 距 最 近 车 站 品尝 专柜 仅 |. | 月 营业 额 

( 坪 ) 距离 (m) 有 在 周 六 开放 人 (万 日 元 ) 
梦 之 丘 总 店 | 10 80 1 0 0 469 
寺 井 站 大 厦 店 8 0 0 0 1 366 
曾 根 店 8 200 1 0 0 371 
桥 本 大 街 店 5 200 0 0 1 208 
桔梗 叮 店 7 300 0 0 1 246 
邮政 局 前 店 8 230 0 0 1 297 
水 道 町 站 前 店 7 40 0 0 1 363 
六 条 站 大 厦 店 9 0 0 1 0 436 
若 叶 川 店 6 330 0 0 È 198 
美里 店 9 180 0 1 0 364 




















那么 ， 通 过 对 以 上 数据 的 分 析 ， 我 们 可 以 求 出 其 重 回归 方程 为 ; 
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图 仅 为 分 类 数据 的 例子 


一 一 


店铺 面积 | 距 最 近 车 站 有 品尝 专柜 | PACER | HELM 
(a) 距离 (m) ee 在 周 六 开放 | 。 (万 日 元 ) 





| — | 
梦 之 丘 总 店 十 469 


1 
寺 间 站 大 厦 店 1 366 
曾 根 店 1 371 

桥 本 大 街 店 0 208 
桔梗 叮 店 0 246 
邮政 局 前 店 1 297 
水 道 町 站 前 店 0 363 
六 条 站 大 厦 店 1 436 
著 叶 川 店 0 198 

1 364 

















SRO Bee bn E eee 
举证: 部- 二 
本 


美里 店 









那么 ， 通 过 对 以 上 数据 的 分 析 ， 我 们 可 以 求 出 其 重 回归 方程 为 ， 





特别 地 ， 我 们 将 这 种 自 变量 仅 为 分 类 数据 的 重 回归 分 析 称 为 数量 化 I 类 。 
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7. EHRE & 








本 节 的 内 容 有 些 难 ， 所 以 只 做 简单 介绍 ， 点 到 即 止 。 

如 果 自 变量 之 间 存在 很 强 的 相关 性 ， 就 会 出 现 如 下 奇怪 的 情况 : 

+ 求 不 出 偏 回归 系数 

* 即便 可 以 求 出 偏 回 归 系 数 ， 也 会 出 现 本 应 是 正 值 的 地 方 ， 不 知道 为 什么 会 求 出 
负 值 。 


在 数学 上 ， 当 出 现 
Su Sa ov Sy 

| SSS) 的 行列 式 ! 的 值 为 0。 
Sy Sa Sy 
Si Sn Sy 
PO A 的 行列 起 的 值 近似 为 0。 
Sh Sa Sip 


这 样 的 情况 时 ， 我 们 就 将 其 称 为 “存在 多 重 共 线性 问题 "。 


我 们 可 以 通过 VIF? RÆVE (Tolerance ) 这 样 的 指标 ， 来 判断 是 否 “存在 多 重 
共 线性 问题 "。 在 Excel 中 ， 求 行列 式 的 值 所 使 用 的 “MDETERM” 函数 ， 也 是 一 种 
求 行列 式 的 值 的 方法 。 
无 论 在 学 习 重 回归 分 析 时 这 个 问题 有 多 么 深奥 ， 读者 只 需 掌握 到 以 下 程度 即 可 ， 
也 就 是 “ 当 自 变量 之 间 存 在 很 强 的 相关 性 时 ， 我 们 可 以 省 去 其 中 任意 一 个 自 变量 后 再 
进行 分 析 "。 
1. 本 书 不 做 说 明 。 


2. 本 书 不 做 说 明 。 
3. 本 书 不 做 说 明 。 
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帘 8.“ 各 自 变量 对 因 变量 的 影响 ”和 重 回归 分 析 & 





对 于 在 本 书 中 初次 接触 重 回归 分 析 的 读者 ， 可 以 跳 过 以 下 内 容 不 做 阅读 。 
重 回归 分 析 ， 不 仅 可 以 用 作 一 种 预测 手段 ， 而 且 也 可 以 用 作 一 种 调查 “各 自 变 
量 对 因 变 量 的 影响 ”的 方法 。 


我 们 来 读 下 面 这 个 故事 。 





鸟 越 先生 是 一 家 糖果 公司 的 产品 开发 研究 员 。 乌 越 先生 最 近 负 责 的 糖果 
销量 非常 好 。 为 了 找 出 这 种 精 果 畅销 的 原因 ， 公 司 邀请 了 一 些 评论 人 员 来 试 
吃 糖果 。 以 下 便 是 当时 使 用 的 调查 问卷 。 





问题 

您 对 这 种 糖果 有 何 评价 ( 每 一 项 只 能 画 一 个 O ) 
Q1 味道 1 不 喜欢 2 一 般 3 喜欢 
Q2 分 量 1 不 喜欢 2 一 般 3 喜欢 
23 便于 食用 1 不 喜欢 2 一 般 3 喜欢 
Q4 包装 设计 1 不 喜欢 2 一 般 3 喜欢 
OS 综合 满意 度 | 1 不 喜欢 2 一 般 3 满意 | 






































下 面 的 表格 记录 的 是 调查 结果 。 
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Q1. 味 道 


Q2. 分 量 Q3. 便 于 食用 





回答 者 1 
回答 者 2 
回答 者 3 
回答 者 4 
回答 者 5 
回答 者 6 
回答 者 7 
回答 者 8 
回答 者 9 
回答 者 10 
回答 者 11 
回答 者 12 
回答 者 13 
回答 者 14 
回答 者 15 
回答 者 16 
回答 者 17 
回答 者 18 
回答 者 19 
回答 者 20 


将 变量 逐一 标准 化 ' 以后， 对 上 表 中 的 数据 进行 分 析 。 于 是 可 以 推导 出 如 下 重 


回归 方程 : 


观察 偏 回 归 系 数 * 的 值 的 大 小 ， 可 知 “Q1. 味道 ”的 值 最 大 。 所 以 ， 乌 越 先生 得 





wee ne DD wD bb 








本 





g 
Desa SA a fe Ss Ol ae 
= 
= 


U w e NYE ewe NNU Nw eww 


y=0.41x, + 0.32x, + 0.26x, + 0.11%, 


QS. 综合 满意 度 QU. 味道 | 


Q2. 分 量 


0Q3 便于 食用 | 
Qt alestit 


出 这 样 的 结论 : 味道 对 综合 满意 度 的 影响 最 大 。 


1 在 调查 “各 自 变量 对 因 变 量 的 影响 ”时 使 用 的 一 种 方法 。 
2 变量 标准 化 以 后 推导 出 的 重 回归 方程 的 偏 回归 系数 ， 被 称 为 标准 偏 回归 系数 。 
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味道 对 综合 满意 度 的 影响 最 大 ， 乌 越 先生 得 出 了 这 样 的 结论 。 我 们 可 以 先 不 去 
管 鸟 越 先 生 的 心情 如 何 ， 但 是 他 的 这 种 想法 是 值得 我 们 关注 的 。 
鸟 越 先 生 认 定 ， 上 表 中 的 各 变量 存在 着 如 下 关系 





[味道 | 








包装 设计 











这 和 我 们 认定 的 重 回 归 分 析 结 构 ' 是 一 致 的 。 但 这 也 未 必 可 行 ， 也 许 真实 的 情 
况 会 是 : 




















味 itt 分 量 [包装 设计 ] 





存在 这 样 的 关系 也 不 是 不 可 能 的 。 

同 重 回归 分 析 相 比 ， 研 究 “ 各 自 变量 对 因 变 量 的 影响 ”更 倾向 于 结构 方程 式 模 
型 这 种 分 析 方法 。 但 是 结构 方程 式 模型 ， 是 一 种 “各 自 变量 对 因 变 量 的 影响 ”可 以 
“自动 地 ”明确 判定 出 来 的 分 析 方法 ， 而 不 是 一 种 没有 规则 的 分 析 方法 。 这 种 分 析 方 
法 需要 分 析 者 在 分 析 前 ， 主 观 地 假定 各 变量 之 间 的 关系 ， 之 后 才能 求 出 路 径 系数 ; 


1. 请 参见 105 页 。 
2. 通常 将 其 称 为 协 方差 结构 分 析 。 
3. 相当 于 重 回归 分 析 中 的 偏 回归 系数 或 标准 偏 回归 系数 。 
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第 4 章 4 
Logistic 回归 分 析 








8 %1. Logistic ADH & 还 要 买 风 见面 包 店 的 
牛角 面 
























































人 
j | eek ane 
N 咖啡 豆 。 T N 
\ 
有 有 1 对 了 ， 
= d 
=e 
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A 





att 
| 

TR 
2 声 AAA A | | 
回归 分 析 $ O) 
















Y 
¢ 
1 


$ fod 
see w 
法 
AN 
Li 
+ OOZ BH xx 大 学 的 
概率 ? 
te ee 概率 是 一 种 特殊 的 数值 
值 吗 ? 它 的 值 一 定 是 在 0 到 
- DAE RRR WE 之 间 。 
ÑN 
if Wl 
N | j y 
DH, HRY \ | re 
\ 民 
\ U ý 


y 
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re) — A 


El 
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{ eT 
Te 





回归 分 析 和 重 回归 分 
析 是 没有 办 法 预测 介 
于 0 到 1 之 间 的 预测 
值 的 。 


所 以 只 能 用 Logistic 
回归 分 析 。 


人 +qpzp+b) 


/ 


这 个 式 子 有 的 人 称 其 为 
“Logistic 回归 模型 "， 而 
RIMMER “Logistic 
回归 方程 "。 








接 下 来 ， 为 了 便于 理解 
Logistic 回归 分 析 ， 我 
们 有 必要 先 了 解 极 大 


似 然 法 的 相关 知识 ， 









l | 
i ba pe Catb) FE 





=- 


0 


0 


a 


它 的 主要 思想 是 把 “使 样 
本 出 现 的 可 能 性 最 大 ” 作 
i 


为 决策 的 准 





7 。 假如 我 们 任意 挑选 10 个 
oe nb 人 ， 问 问 他 们 “ 喜 不 喜欢 
es + 诺 伦 的 制服 ?” 





作为 总 体 的 “我 们 大 学 全 休 在 校 
学 生 ” 对 诺 伦 的 制服 的 支持 率 假 
RAP, 


Ge tonnvog®ds 
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像 刚 刚 表 中 的 那 种 情况 ， 发 生 
的 概率 应 该 是 这 样 的 。 


Bm FER Bm FER Br Bx Bx Bx 不 喜欢 Br 


Px (I-P)xPx((-P)xpP xpPxpPxpx((-p)xP 
=p(I-P) 


所 谓 的 极 大 似 然 法 ， 从 作为 总 体 的 “我 们 大 学 全 体 在 校 学 生 ” 
这 个 例子 看 ， 就 是 ABE AMAR 局 的 值 ， 一 定 会 令 


p-p? 
或 者 
log{p"(1—p)} 
的 值 为 最 大 。 








O Ol 02 03 04 O5 abfarjog of I 


= 











0+ + 
logit- 0 Ql 02 03 04 05 06 e os 09 

















它 的 基本 想法 ， 可 以 这 样 
解释 。 


从 图 像 上 解释 的 话 ， 就 是 求 
这 些 图 像 最 高 点 所 对 应 的 横 
轴 坐 标的 一 种 想法 。 
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P'-py 称 为 “ 似 然 函数 "。 
log{p"(1-p)} 称 为 “对 数 似 然 函数 "。 一 > 似 然 函 数 


| (09 fort-py? 
Pe: > APA RBI 


(esp 
Fite AIK EREA 


BAR BH, EAH 
值 为 最 大 时 的 p 值 ， 被 
称 为 " 极 大 似 然 估计 值 "。 


t $ z 那么 ， 就 来 求 一 下 诺 伦 
极 大 似 然 法 是 求解 极 大 似 Er 制服 的 例子 中 的 极 大 似 
然 估 计 值 的 一 种 方法 了 1 然 估计 值 吧 | 


4 ai 
YK 

VY < 4 

Va 
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SED unra. 


px(1—p)xpx(1—p)xpxpxpxpx(l—p)xp 





=p'(1—py | 








<p 求 对 数 似 然 函数 ， 并 整理 。 
L=log{p’ (1-p)'} 
= log p’ + log(1 一 站 
= log p + 3log(1 - p) 











此 后 ， 将 对 数 似 然 函 数 记 为 L。 


























H 
CID nae KF PRM, 今 其 值 为 0。 
dL 1 1 1 1 
Dn er i UL 
CID ee es 中 的 式 子 ， 求 出 极 大 似 然 估计 值 
1 1 
7x—-3x7—=0 
P 1-p 
1 1 
(pry 9-9-0» RTS 
7(1-p)-3p=0 
7-7p-3p=0 
7-10p=0 kR H 
极 大 似 然 
oi 估计 值 | 
上 10 al 
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诺 伦 特 供 ”好 


就 用 e} 
q / { S 
IRA 


\ : 
/ 
分 析 | 


lle 






bid 
è 










特 供 ， 就 是 店 里 的 \ 
AR AK DD 






kd 
= 


基本 看 老板 的 心情 才 会 
Hh WEAK, 











f WERK, GARR | | 
1 个 , 7000 日 元 。 


A 1 
多 Kl 
j A 
| 
\ 

















HHUA 


但 是 ， 价 格 低 也 不 能 保 
EECA REBAR AR 
能 卖 出 去 ， 是 吧 ? 


BER tos, 

我 们 就 来 求 一 下 预测 卖 出 
概率 的 

Logistic 回归 方程 吧 ! 


EE 


这 也 是 我 一 直 以 来 都 在 考 
Bh, SERRE A 


“气温 高 的 日 子 
“周三 、 周 六 或 周 日 


比较 好 卖 。 


而 周三 是 因为 附近 大 学 的 
社团 成 员 经 常 来 诺 伦 聚 会 
这 样 ， 人 也 显得 比较 多 | 
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pig 


最 高 气温 (C ) | OC ez 


x8 
z4 
26 
4 
23 

28 
24 
26 
2 
z7 
2I 
22 
27 
26 
26 
zI 

2/ 

27 
z3 
2z 
24 





s62} 
68(=) 


@(=) 
所 以 ， 我 已 经 斌 ea 
着 将 最 近 的 数据 


9 日 (五 ) 
记录 下 来 了 。 108( 六 ) 


11B(B) 
12 8(-) 
13 8(=) 
148(5) 
15 日 (四 ) 
16 日 (五 ) 
17 日 (六 ) 
18B(B) 
198(—) 
208(=) 
218(5) 
228(@) 
23 日 (五 ) 


24 日 (六 ) 
258(8) 


7-~7eo°9+-9O90-~90~99~~90-~-90 
—seooroO+~S90~On~o~SO 90S NK 














所 以 ， 还 不 能 由 此 
进行 分 析 ! 
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在 做 Logistic 回归 分 析 时 ， 
“1” 表 示 “ 特 供 盐 粒 被 卖 出 的 概率 是 1"， 
"O 表示 “ 特 供 鼻 磅 被 卖 出 的 概率 是 0"。 


V 


本 来 是 分 类 数据 的 ， 
把 它 看 成 数值 数据 。 
Lp 人 
eee { 
& Logistic 回归 分 析 中 ， 
自 变量 可 以 是 
* 仅 为 数值 数据 
BHD RBM 
“数值 数据 和 分 类 数据 的 混合 


无 论 哪 一 种 ， 都 可 以 进行 分 析 。 














Logistics 回 


归 分 析 的 实例 只 











那 是 不 是 也 同 回归 分 
析 或 者 重 回归 分 析 一 


我 觉得 基本 上 
没什么 区 别 。 






Logistic 回归 分 析 的 过 程 : 


© 首先 ， 为 了 讨论 是 否 具有 求解 Logistic 回归 方程 的 意义 ， 
画 出 各 个 自 变量 和 因 变 量 的 散 点 图 。 


ò SRM Logistic 回归 方程 。 

o 确认 Logistic 回归 方程 的 精度 。 
@ 进行 “回归 系数 的 检验 ”。 

© mm. 


| Ò 这 就 是 Logistic 回归 分 析 的 
\ 过 程 。 











O 首先 ， 为 了 讨论 是 否 具有 求解 Logistic 回归 方程 的 意义 ， 画 出 各 个 
自 变 量 和 因 变 量 的 散 点 图 。 





Logistic 回归 分 析 在 Logistic 回归 分 析 

也 是 从 画图 开始 做 中 ， 最 好 将 因 变 量 作 

的 为 模 轴 ， 这 样 便于 观 
察 。 


特 供 玻 焙 的 销售 情况 A=, MASER 特 供 蛋 糙 的 销售 情况 最 高 气温 





单 相 关系 烙 = 0.5095 单 相 关系 铬 = 二 0.4828 


1 


a 
网 
六 
或 
周 
B 











1 t 
RRR AZ | FEAR TA A AZ 





或 许 

真 的 存在 a, ERM, 

这 样 的 关系 呢 | 看 起 来 具有 求解 
Logistic 回归 方程 的 意义 | 


点 的 位 置 用 是 重 
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| @ RÜ Logistic 回归 方程 








MA 


Sal 
Al 





ED. 计算 这 程 如 下 表 所 述 : 


周三 、 周 六 或 周 日 | i 特 供 蛋 楼 的 销售 情况 
销售 情况 


D=— 
Tt ) 





1 
Ora 
1+e 


nora 
1+e 


EIET] 








25H (H) 1+e 





SED on RHA. 


1 1 TEN 1 


f= 
“lay x00, x284D) TEE 1 + e OITA 


Seth 没有 卖 出 卖 出 





1+e 


SED oes Ret MRK. 





1 1 1 
L=log x|1- 





1 1 
= log ax0va,xaeeny | + log | 1 一 axor xasi | +*+ log sree 
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ED 求解 极 大 似 然 估计 值 。 


极 大 似 然 估计 值 ， 就 是 使 对 数 似 然 函数 工 的 值 最 大 时 a,、a, 和 6。 的 值 。 
a= 2.44 
a= 0.54 


b =-15.20 





求解 方法 请 参照 第 208 页 。 
对 数 似 然 函 数 工 的 最 大 值 ， 虽 然 和 步骤 4 没有 直接 关系 ， 但 是 考虑 到 其 重要 性 ， 在 
这 里 先 讲 一 下 。 如 下 所 示 : 


1 1 1 
L=log or |+log |1- urns | + *** + log EIEEE EE 
Ite Ite Ite 





=-8.9 





SED ki Logistic HE, 


对 比 步骤 4 可 知 ，Logistic 回归 方程 为 


1 


i 1 + ent os 1520) 
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4 tye 
Bh, MALES | +@ -QO Z) 


Logistic 回归 方程 ! 














那么 ， 现 在 就 来 确认 一 下 
所 求 得 的 Logistic 
回归 方程 的 精度 吧 ! 


Logistic 回归 方程 中 ， 
也 存在 “ 重 相关 系数 ”和 
“判定 系数 ” 吗 ? 


不 是 ，Logistic 回归 方程 


RAAR AK 
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Logistic 回归 方程 的 判定 系 
数 的 值 是 通过 这 样 的 计算 求 
解 出 来 的 | 


K RTP HK L 的 最 大 值 
a Ailogni+Nologno~(it Re) log (Ait ho) 


与 回归 方程 和 重 
回归 方程 完全 不 
Fits | 


量 的 值 为 1 MED 
的 值 为 0 MRT RR 


是 这 样 的 意思 。 


对 数 似 然 函 效 的 最 大 什 
Ni logit nolg ro- (ht Ro) log it Po) 


ry 
A U 
& (og § + (3 log (3- (8+3) (09 (8+13) 


x, 
想不到 会 这 么 低 。 





170 第 4 章 Logistic 回归 分 析 


nzannmi MEIZ A = 
范围 同样 为 从 0 E 
是 这 样 吗 ? 


Logistic 回归 方程 的 精度 越 高 ， 
值 越 接近 1, KZ, WARIO, 


尽管 如 此 ， vy 
Logistic 回归 方程 的 判定 系数 K 
的 值 基本 上 

都 不 是 很 大 

所 以 ， 参 考 程度 十 分 有 限 。 











5 日 一 ) 0 28 
6 日 一) 0 24 
7 日 三 ) 1 26 
8 日 四 ) 0 24 
9 日 (五 ) 0 23 
10H) 1 28 
1 日 (日 ) 1 24 
12 日 一 ) 0 26 
13 日 二) 0 25 
1 28 

15 日 (四 ) 0 21 
16 日 (五 ) 0 22 
17 日 (六 ) 1 27 
18 日 (日 ) 1 26 
0 26 

0 21 

) 1 21 

22 A (W) 0 27 
23 (Hi) 0 23 
24 日 (六 ) 1 22 
25 日 (日 ) 1 24 














Ret 


出 了 
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7 日 和 11 日 明明 是 没有 
卖 出 的 ， 但 是 了 却 显示 卖 


0.80 ( 卖 出 ) 
0.58 ( 卖 出 ) 





12. 日 和 21 日 明明 是 卖 出 了 ， 
但 是 了 却 显示 没有 卖 出 。 





0.51 ( 卖 出 ) 
0.11 ( 没 卖 出 ) 
0.80 ( 卖 出 ) 
0.11 ( 没 卖 出 ) 


0.06 ( 没 卖 出 ) 
PRIMALI O.S 
Oe? ORHI 的 话 ， 我 们 或 可 以 将 


0.58 ( 卖 出 ) A 四 
0.26 ( 没 卖 出 ) 其 看 作 “ 卖 出 "。 


0.17 ( 没 卖 出 ) 


0.92 (SEH) 7 
0.02 ( 没 卖 出 ) 但 是 ， 你 看 看 这 


0.04 ( 没 卖 出 ) 个 表 有 没有 发 现 
0.87 ( 卖 出 ) 

0.80 ( 卖 出 ) 

0.26 ( 没 卖 出 ) 
0.02 ( 没 卖 出 ) 
0.21 ( 没 卖 出 ) 
0.38 ( 没 卖 出 ) 
0.06 ( 没 卖 出 ) 
0.31 ( 没 卖 出 ) 
0.58 ( 卖 出 ) 
























im) | 


o) 人 


ae 


py: 


啊 ， 对 了 ， 还 有 另外 一 个 可 
以 确认 Logistic 回归 方程 精 





用 来 确认 Logistic 回归 方程 
精度 的 “ 误 判 率 " 是 


全 部 个 体 个 数 


这 个 值 越 小 ，Logistic 
回归 方程 的 精度 越 高 ! 


Shy tp Heew, R 
后 再 求 出 其 单 相关 系数 ， 
也 是 可 以 的 。 





| @ 进行 “回归 系数 的 检验 ” 








RE, Logistic 回归 分 析 也 
要 进行 “回归 系数 的 检验 "。 





“回归 系数 的 检验 "， 但 是 
这 里 有 多 个 自 变量 


原 假设 


"A= 人 2=0” 不 成 立 SARE 
P, FOER-BKARY 





Al FORA? #0 
重 回归 分 析 


Al #OBA2=0 时 的 禾 记 本 


“大 1=0 甩 人 2 天 0 


那 就 具体 地 算 一 下 吧 ， 
有 意义 的 标准 还 是 0.05 | A 


UO) an 


AS Ly 

















首先 ， 进行“ 全 面 讨论 偏 回归 系数 的 检验 ”。 
顺便 提 一 下 ， 通 过 下 述 计 算 进 行 的 检验 ， 通 
( Likelihood Ratio 


常 被 称 为 “ 似 然 比 检验 ” 
Test )。 














将 “周三 、 周 六 或 周 日 为 x， 、 最 高 气温 为 x2 °C 
的 日 子 ”作为 总 体 。 





原 假设 为 “41=42=0 RIL” o 














a) RR IIB PBI “ A1=42=0 不 成 立 ”。 
DRS | 选择 所 要 进行 的 “检验 ”类 型 。 进行 “全 面 讨论 偏 回 归 系数 的 检验 "。 
此 对 | 设 定 有 意义 的 标准 。 以 0.05 为 有 意义 的 标准 。 
F 面 进行 “全 面 讨论 偏 回归 系数 的 检验 "。 
“全 面 讨论 偏 回归 系数 的 检验 ”的 检验 统计 量 为 
2[ 对 数 似 然 了 数 的 最 大 值 -mlogn-nologno+ (n+ 
IIR 5 | 通过 样本 数据 求 出 检验 统计 量 的 值 。 。 | ”olog(orrnol 


所 以 ， 在 本 例题 中 的 检验 统计 量 的 值 为 

2[-8.9010-8log8-13log13+(8+13)log(8+13)]=10.1 
在 本 例题 中 ， 如 果 原 假设 成 立 ， 那 么 检验 统计 量 
就 服从 自由 度 为 X = 自 变量 的 个 数 ) 的 Xx? 分 布 *。 





再 将 步骤 5 中 求 出 的 检验 统计 量 的 值 所 
对 应 的 P 值 ， 与 有 意义 的 标准 进行 比较 ， 
看 看 P 值 是 否 比 其 小 。 


BIR 6 


有 意义 的 标准 是 0.05。 检 验 统计 量 的 值 为 10.1， 
所 以 P 值 为 0.006。 
0.006<0.05。 所 以 P 值 较 小 。 





— 
如 果 在 步 台 6 中 ,P 值 比 有 意义 的 标准 小 ， 
我 们 就 可 以 得 出 “ 备 择 假 设 成 立 ” 的 结 
论 。 反 之 ,我 们 就 可 以 得 出 “ 原 假设 成 立 ” 
的 结论 。 


步骤 7 








与 有 意义 的 标准 相 比 ，P 值 较 小 。 所 以 ， 备 择 假 
设 成 立 。 





K X2 分 布 中 己 值 的 求解 方法 请 参见 第 201 页 。 
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我 们 以 A 为 检验 对 象 ， 示 范 一 下 
顺便 提 一 下 ， 通 过 下 述 计算 进行 的 检验 ， 通 常 被 
称 为 “Wald 检验 ”。 


接 下 来 ， 进 行 “分 别 讨论 偏 回归 系数 的 检验 ”。 | 








将 “周三 、 周 六 或 周 日 为 x1、 最 高 气温 为 才艺 的 
日 子 ”作为 总 体 。 

原 假设 为 “41 = 0 成 立 "。 

备 择 假设 为 “4 和 0 成 立 "。 

选择 所 要 进行 的 “检验 ”类 型 。 进行 “分 别 讨论 偏 回归 系数 的 检验 "。 

设 定 有 意义 的 标准 。 以 0.05 为 有 意义 的 标准 。 

下 面 进行 “分 别 讨论 偏 回归 系数 的 检验 "。 | 





建立 原 假设 和 备 择 假设 。 











“分 别 讨论 偏 回归 系数 的 检验 ”的 检验 统计 量 为 

2 
sm, 
过 样本 数据 求 出 检验 统计 量 的 值 。 Sie Pum emt aie 
2.44 


1.5388 >? 
在 本 例题 中 ， 如 果 原 假设 成 立 ， 那 么 检验 统计 量 
| 就 服从 自由 度 为 1 的 xz 分 布 。 





| 再 将 步 又 5 中 求 出 的 检验 统计 量 的 值 所 y ; 1 
应 的 己 值 ， 与 有 意义 的 标准 进行 比较 ， 有 意义 的 标准 是 0.05。 检 验 统计 量 的 值 为 3.9。 


看 看 值 是 否 比 其 小 所 以 呈 值 为 0.0489。0.0489<0.05, 所 以 P 值 较 小 。 





如 果 在 步骤 6 中 PP 值 比 有 意义 的 标准 小 ， 
则 我 们 就 可 以 得 出 i ”的 | 与 有 意义 的 标准 相 比 ，P 值 较 小 。 
所 以 ， 备 择 假 设 “41 zx 0” 成 立 。 





HE S51 的 求解 方法 见 下 页 说 明 。 





在 有 些 参考 资料 中 ， 不 是 依据 分 布 ， 而 是 依据 
标准 正 态 分 布 来 讲解 “回归 系数 的 检验 ”。 

H 这 个 问题 从 数学 的 角度 解释 起 来 比较 困难 ， 所 以 
我 们 不 做 详细 介绍 。 但 是 ， 无 论 依据 哪 种 分 布 ， 
其 最 终 的 结论 都 是 相同 的 。 























[Fae SS | I aes | 
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I I T7] 
ised 5 中 出 现 的 S" 是 这 样 求 出 来 的 。 


ana eg ne -$) 0 e 0 0 
(6 日 的 ?) x! CE $) | 9 om 
= m $)x -$) 
2 i 049 0 o yo 2 nm 
011x089 *** 0 Wt 
= b 24 … 
a = 058x042 作 1 24 1 


为 了 便于 计算 ， 这 里 必须 全 部 填 上 1。 | H 





















(0.0881) 





























































AA A 
pi 
HISA 
天 
高 ç 
以 


星期 日 ， 
RR 23° 
是 这 样 。 


今 
最 
所 





| 











: a 
| 真 的 十 分 感谢 1 IAA 
ae A | 





E 





n 





Y 至此， 有关“ 回归 分 析 " 中 的 
。 回 归 分 析 


。 重 回归 分 析 
e Logistic 回归 分 析 
的 学 习 ， 就 告 一 段落 了 1 





Bs 
R 
ia 
k: 
A 
还 要 继续 努力 啊 | 








E 


这 样 ， 无 论 他 什么 时 候 
来 ， 你 们 不 就 能 有 共同 
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只 5.“Logistic 回 归 分 析 过 程 ” 中 的 注意 事项 & 





下 图 再 次 给 出 第 164 页 出 现 的 “Logistic 回归 分 析 过 程 "。 


Q 首先 ， 为 了 讨论 是 否 具有 求解 Logistic 回归 方程 的 意义 ， 画 出 各 个 自 变量 和 
因 变 量 的 散 点 图 。 

@ 求解 Logistic 回归 方程 。 

l 













图 确认 Logistic 回归 方程 的 精度 。 
l 

@ 进行 “回归 系数 的 检验 ”。 

} 

© 预测 。 









图 4.1 Logistic 回归 分 析 过 程 


此 前 ， 在 我 们 的 讲解 中 ， 必 须 完成 上 图 中 的 第 @ 步 到 第 @ 步 。 但 事实 并 非 如 此 ， 
同 回归 分 析 、 重 回归 分 析 一 样 ， 不 同 的 情况 下 ， 只 完成 第 〇 步 到 第 @ 步 就 可 以 了 。 





$ 6. Odds Ratio (优势 比 ) 党 





本 节 的 内 容 较 为 抽象 。 如 果 是 在 本 书 中 初次 接触 Logistic 回归 分 析 的 读者 ， 可 
以 跳 过 这 一 部 分 ， 不 做 阅读 。 但 是 ， 从 事 与 医 疗 相关 领域 的 读者 ， 还 请 您 稍 作 了 解 。 
6.1 Odds 和 Logit 

可 以 改写 成 为 


l+e 








y= 





7 z. 
Toy =” Klog tay a? 
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于 是 ， 第 168 页 所 得 到 的 = aa sama 可 以 改写 为 ， 
z 


E a erm 40.5483 ~ 15.20 
Try 


log SET =2.44x, +0.54x, — 15.20 


TZM Oddso log 7% 叫做 Logit。 在 本 章 的 例子 中 ，Odds 就 是 = “710312, 


而 Logit 就 是 2.44x, + 0.54x, - 15.20 。 
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6.2 优势 比 ( Odds Ratio ) 和 风险 比 ( Risk Ratio ) 

















下 表 再 次 给 出 第 162 页 的 表格 。 
OR41 第 162 页 的 表格 
周三 、 周 六 或 周 日 最 高 气温 (C) 特 供 蛋 糕 的 销售 情况 
L iz 本 

5 日 一 ) 0 28 1 
6 日 一) 0 24 0 
78(=) 1 26 0 
8 日 四) 0 24 0 
9 日 五 ) 0 23 0 
10 日 (六 ) 1 28 1 
11 日 (日 ) 1 24 0 
12 日 一) 0 26 1 
13 日 (二 ) 0 25 0 
14 日 (三 ) 1 28 1 
15 日 (四 ) 0 21 0 
16H (Hi) 0 2 0 
ITH) 1 27 1 
18 日 (日 ) 1 26 1 
19 日 一 ) 0 26 0 
0 21 0 

1 21 1 

22 日 四 ) 0 27 0 
23H (Hi) 0 23 0 
24 日 (六 ) 1 22 0 
25 日 (日 ) 1 24 1 

下 表 是 “周三 、 周 六 或 周 日 ”与 “ 特 供 蛋糕 的 销售 情况 " 的 联 列表 ( Cross-Tabulation 
Table ) 


多 表 4.2 “周三 、 周 六 或 周 日 ”与 “ 特 供 蛋 灿 的 销售 情况 ” 的 联 列表 


特 供 蛋糕 的 销售 情况 
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由 这 个 联 列表 可 知 , “周三 、 周 六 或 周 日 的 卖 出 率 ”为 和 ，“ 周 三 、 周 六 或 周 日 
以 外 的 卖 出 率 " HZ 。 


在 实际 操作 中 ， 往 往 会 用 到 风险 比 的 概念 。 
所 谓 风险 比 ， 以 表 4.2 来 说 ， 就 是 : 


周三 、 周 六 或 周 日 的 卖 出 率 _ (3) 








可 aby E26=4 
周三 、 周 六 或 周 日 以 外 的 卖 出 率 (3) on oe 3 
在 实际 操作 中 ， 往 往 还 会 用 到 优势 比 的 概念 。 
所 谓 优势 比 ， 以 表 4.2 来 说 ， 就 是 : 
周三 、 周 六 或 周 日 的 卖 出 率 eal 图 
本 6 3 6 
( ieee | x 1-($) S & DE ee E 
2 2 < mS t 





= 以 外 的 卖 出 率 2) 2) [2 
( e TE eee) kal te [i] 
E 的 


以 上 的 例子 中 ， 表 面 上 看 来 ， 优 势 比 虽然 与 风险 比 有 些 差别 ， 但 实际 上 ， 它 们 
的 值 表示 含义 是 相同 的 ， 所 以 ， 人 们 常常 用 优势 比 来 替代 风险 比 。 





6.3 未 调整 的 优势 比 和 调整 后 的 优势 比 


下 表 记录 的 是 采用 最 优 子 集 法 对 表 4.1 中 的 数据 进行 的 分 析 。 
ORAS 表 4.1 中 数据 的 最 优 子 集 法 分 析 结果 





@ | 仅 为 “周三 、 周 六 或 周 日 ” > = Ear 






e-i 





@ | 仅 为 “最 高 气温 ” > ET rea) 


em- 1344 








1 
Taan rosan i320) | %44 t 034-1520 





@| “周三 、 周 六 或 周 日 ”和 “最 高 气温 ” 





= 
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“e 的 “情况 时 的 回归 系数 ”次 方 ”为 ewx， 于 是 有 


周三 、 周 六 或 周 日 的 odds _ e719 230x1-161-@30x0-160) _ 230 
周三 、 周 六 或 周 日 以 外 的 odds 。 ee 
我 们 将 其 称 为 没有 对 “周三 、 周 六 或 周 日 ”进行 调整 的 优势 比 。 顺 便 说 一 下 ， 
w=10， 这 个 值 同 前 一 页 求 得 结果 是 一 致 的 。 





“e 的 “情况 @ 时 的 回归 系数 ”次 方 ”为 es， 于 是 有 


最 高 气温 为 (k+1) 所 的 odds _ 92% 4+) -094 = 0052x0144-(052xk-1349 _ 032 
最 高 气温 为 的 odds C52xk-1344 
我 们 将 其 称 为 没有 对 “最 高 气温 ”进行 调整 的 优势 比 。 





“e 的 “情况 @@ 时 的 回归 系数 ”次 方 ”为 e%， 于 是 有 
2.44 x 1 +0.54 x k= 15.20 
e =o 2A4K140.54 xk- 1520- (244 040.54 xk- 15.20) _ 244 
@ 244 x0+0.54 xk- 15.20 c= me 


我 们 将 其 称 为 对 “周三 、 周 六 或 周 日 ”进行 调整 的 优势 比 。 


“e 的 “情况 @@ 时 的 回归 系数 ”次 方 ”为 os%， 于 是 有 


244x1+054xtk+D)-1520 g 2.44x0+0.54 x (k+ 1)- 15.20 


054 x(k+ 1)~ 15.20 ~(0.54 xk~15.20) _ 0.54 





e 2x 14054 xR 15.20 @ "A xO+054 xR 15.20 


我 们 将 其 称 为 对 “最 高 气温 ”进行 调整 的 优势 比 。 


6.4 总 体 优势 比 的 检验 


在 介绍 Logistic 回归 分 析 的 文献 中 ， 有 时 会 提 及 “总 体 优势 比 的 检验 ”。 “总 体 
优势 比 的 检验 ”和 第 176 页 所 讲 过 的 “分 别 讨论 偏 回归 系数 的 检验 ”一 样 。 但 是 原 
假设 和 备 择 假设 却 有 所 不 同 。 同 “分 别 讨论 偏 回归 系数 的 检验 ”中 的 


原 假设 A=0 
备 择 假设 A#0 


相 比 ,“ 总 体 优势 比 的 检验 ”中 则 是 : 





原 假设 et=eo-1 
备 择 假设 e4e=1 
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6.5 总 体 优 势 比 的 估计 


一 般 情 况 下 ， 之 前 所 讲 的 “总 体 优势 比 的 检验 ”的 结果 ， 会 同 总 体 优势 比 的 置 
信 区 间 一 起 介绍 ， 至 少 在 与 医疗 相关 领域 是 这 样 的 。 所 以 下 面 来 介绍 一 下 总 体 优势 
比 的 置信 区 间 的 求解 方法 。 
例如 ， 在 本 章 的 例子 中 ， 当 置信 度 为 95% 时 ,“ 周 三 、 周 六 或 周 日 ”的 总 体 优 
势 比 的 置信 区 间 可 以 通过 以 下 计算 求 得 。 当 置信 度 为 99% 时 ,只 需 将 下 图 中 的 “1.96” 
换 成 “2.58” 即 可 。 
置信 空间 


EEC eT SSL SED 


Se ee 


T aika eM ois ms 19N 优势 比 
: nits 
ae TII = tM 96 (TSR 
=10 = 130.8 


图 4.2 ”置信 度 为 95% 时 、“ 周 三 、 周 六 或 周 日 ”的 总 体 优 势 比 的 置信 区 间 


HE a 的 值 请 参照 第 168 页 。S" 的 值 请 参照 第 177 页 。 








宽 7.“ 检 验 ” 的 名 称 只 





在 “第 2 章 回归 分 析 ”"、“ 第 3 章 重 回 归 分 析 ” 和 “第 4 章 Logistic 回归 分 析 ” 
中 ， 出 现 了 这 么 几 种 “检验 ”; 回归 系数 的 检验 、 偏 回归 系数 的 检验 、 全 面 讨论 ( 偏 ) 
回归 系数 的 检验 、 分 别 讨论 ( 偏 ) 回归 系数 的 检验 、 总 体 优势 比 的 检验 。 

这 些 名 称 是 笔者 自己 的 想法 ， 并 非 通用 的 名 称 。 这 样 做 也 是 苦于 找 不 到 通用 的 
名 称 。 此 外 , 似 然 比 检验 、wald 检验 这 些 名 称 则 是 通用 的 名 称 , 而 非 笔者 自己 的 观点 。 
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& 8. Bubble Chart (气泡 图 ) & 





本 节 所 讲 的 内 容 同 Logistic 回归 分 析 没有 任何 关系 ， 但 是 却 比较 有 用 ， 所 以 在 
这 里 稍 作 介绍 。 

在 第 165 页 中 ， 美 羽 为 了 避免 在 同一 个 地 方 重复 画 点 所 使 用 的 方法 ， 是 一 个 不 
错 的 主意 。 但 是 如 果 点 的 个 数 更 多 , 例如 21 个 甚至 210 个 的 话 , 就 会 弄 得 到 处 是 点 ， 
最 终 变 成 一 幅 不 知 所 谓 的 图 ， 同 不 使 用 这 种 方法 也 没什么 差别 。 

人 们 常常 会 使 用 Bubble Chart (气泡 图 ) 这 样 的 图 表 。 所 谓 Bubble Chart， 就 是 
通过 气泡 的 大 小 来 表示 点 的 多 少 的 一 种 图 表 。 

下 图 就 是 同 第 165 页 中 的 图 相对 应 的 Bubble Chart。 





NESS |x 
w 
Q 





© 











诺 伦 特 供 和 蛋糕 的 销售 情况 


图 4.3 同 第 165 页 中 的 图 相对 应 的 Bubble Chart 
在 “周三 、 周 六 或 周 日 ” 卖 出 的 诺 伦 特 供 蛋糕 ， 以 及 “周三 、 周 六 或 周 日 ”以 
外 没有 卖 出 的 诺 伦 特 供 蛋糕 ， 就 变 得 一 目 了 然 了 。 
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附录 4 
用 Excel 算 算 看 


TS 





附录 中 所 用 数据 已 经 传送 到 网 站 http://www.okbook.co.cn/， 名 为 “数据 - 
回归 .xls” 的 文件 夹 中 ， 请 您 下 载 使 用 。 











这 里 将 对 以 下 内 容 进行 讲解 
1. 自然 对 数 的 底 
2. 指数 函数 
3. 自然 对 数 函 数 
4 .矩阵 的 乘法 
5. 逆 和 矩阵 
6. 和 分布 的 横 轴 坐标 
7. 和 2 分 布 的 概率 
8. 下 分 布 的 横 轴 坐标 
9. F SYA 
10. (HE) 回归 分 析 的 ( 偏 ) 回归 系数 
11, Logistic 回归 方程 的 回归 系数 


1. 自然 对 数 的 底 








选择 “B1” 单 元 格 。 


B 
I e 也 就 是 e 乘 以 1 


选择 菜单 栏 中 的 “插入 ” 栏 内 的 “函数 ”。 
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在 “选择 类 别 ” 中 选择 “数学 与 三 角 函 数 ”, 在 “选择 函数 ”中 选择 “EXP”。 








直接 输入 1 后 ， 点 击 “确定 "。 


aver 国 *! 


= 2times 
98M 6 9 0 te 


Yonder MAR HR 6 ME 2 it26102045904， A DAUNIN 





Dil 


ET Cee Cea) 





A B 
。_ 世 就 是 e 乘 以 1 2.718282 





H 
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2. 指数 函数 





选择 “B1” 单元 格 , 像 在 Word 文档 中 的 输入 方法 一 样 ,在 其 中 输入 “=2^3” 后 ， 
按 下 “Enter” 键 。 


图 2 的 3 次 方 E23 
计算 完毕 ! 
3. 自然 对 数 函 数 





选择 “B1” 单 元 格 。 


Steven koa! 
国志 (的 3 次 方 ) 


选择 菜单 栏 中 的 “插入 ” 栏 内 的 “函数 ”。 


在 “选择 类 别 ”中 ， 选 择 “数学 与 三 角 函 数 "， 在 “选择 函数 ”中 选择 “LN”, 
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直接 输入 “exp (3)” 后 ， 点 击 “ 确 定 "。 











4 
f > a 
pE! 
+ 
w 
a 
A2 
Ax 
48 
计算 完毕 ! 


| log (e 的 3 次 方 ) 
9 


4. 矩阵 的 乘法 





选择 “G1” 单 元 格 。 


a 
2 3) 4 jeer 4, | | 


选择 菜单 栏 中 的 “插入 ” 栏 内 的 “函数 "。 


在 “选择 类 别 ” 中 选择 “数学 与 三 角 函 数 ", 在 “选择 函数 ”中 选择 “MMULT”, 
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选择 下 图 所 示 的 范围 ， 点 

























ae x = (0,19:691) 
AERIDES, AVERETT Array! H, MURAD Array? 相等 





PRERREB ER Pets 


以 “G1” 单 元 格 为 起 点 ， 按 照 下 图 选择 从 “G1” 到 “H2”。 




















B C_ -了 E 


TE F i; 
1 2 48 for | 
3 4 -2 4 Loe 
3 


点 击 数学 公式 栏 中 的 这 一 部 分 。 








=WMULT (A1 :B2, D1 :E2) 





一 起 按 下 “Shift” 键 和 “Ctrl” 键 ， 同 时 再 按 “Enter” 键 。 


计算 完毕 ! 
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5. EE 








选择 “D1” 单 元 格 。 


选择 菜单 栏 中 的 “插入 ” 栏 内 的 “函数 ”。 


在 “选择 类 别 " 中 选择 “数学 与 三 角 函数 ", 在 “选择 函数 " 中 选择 “MINVERSE"。 


选择 下 图 所 示 的 范围 ， 点 击 “ 确 定 ”。 


a Wot Neat on a te a 
JA 
3j 4 | 





“Re he 


ls 


BEEBE lolalale BB 








以 “D1” 单 元 格 为 起 点 ， 按 照 下 图 选择 从 “D1” 到 “E2”。 


| ES 
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点 击 数学 公式 栏 中 的 这 一 部 分 。 





{EMINVERSE (A1 :B2)} 





一 起 按 下 “Shift” 键 和 “Ctrl” 键 ， 同 时 再 按 “Enter” 键 。 


计算 完毕 ! 





6. X 分 布 的 横 轴 坐标 





选择 “B3” 单 元 格 。 
概率 0. 05| 
自由 度 2) 
2, 
a | 


选择 菜单 栏 中 的 “插入 ” 栏 内 的 “函数 ”。 


在 “选择 类 别 ” 中 选择 “统计 ”， 在 “选择 函数 ”中 选择 “CHIINV”。 
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选择 “B1” 和 “B2” 单 元 格 ， 点 击 “确定 "。 
A 一 一 CR a S 
自由 度 | 一 对 


zl 
Xan 


























Dec treedon BIE, TF 1 与 10.10 218, FA 10°10 


MRE s 091484547 





SEEBEEEEELEEPEERIEE 


计算 完毕 ! 
hme | 0..05| 
自由 度 | 2 
LAN 
7. CPA 





选择 “B3” 单 元 格 。 
| 
X 分 布 10.1 


自由 度 | 2 


概率 =a 





TEEL 


选择 菜单 栏 中 的 “插入 ” 栏 内 的 “函数 ”。 
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在 “选择 类 别 ” 中 选择 “统计 ”， 在 “选择 函数 ”中 选择 “CHIDIST”。 


选择 “B1” 和 “B2” 单 元 格 ， 点击 “确定 ”。 








A ET (es) ees eed ae Se 
arim 10. 1 | | | 
2 | 自由 度 i 2 | | | 
Eer [(ST(Bi, B2) | 
44 OS SAS SA as | 
a | 
£ | 
pa 
8] 

a | 

sta 

az] Äi K 

ETI Dog freedom 。 自由 度 ， 介 于 1 与 10°10 2M, Fe 10°10 

ad 

bo 计算 结果 =。 0.008409333 

aq HA Cae Cea] 

















计算 完毕 ! 
a r PE 10.1| 
2 | 自由 度 
ine 
8， 上 分 布 的 横 轴 坐标 





选择 “B4” 单 元 格 。 
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选择 菜单 栏 中 的 “ 插 人 ” 栏 内 的 “函数 "。 


在 “选择 类 别 ” 中 选择 “统计 "， 在 “选择 函数 ”中 选择 “FINV"。 


选择 “B1”、“B2” 和 “B3” 单 元 格 ， 点 击 “ 确 定 "。 
A fam cp | S | P | 
概率 0. 05 
第 1 自由 度 
第 2 自由 度 12 





















rw 
Prorail 
‘Dag freedos! B2 

Deetrosdost 四 I 2 


41020538 
E OR) MROLOITIN TOR p = MIST Ge...) 6M JING, ) © ae 


Deg trveden? SHEMB, HF 19 10°10 ZIM, RO 10°10 


itm = a T41225206 


天 这 的 要 00 Caz Cea) 








SEEBEBEEREEEEEEPEERE 


计算 完毕 ! 


| 0.05 
第 1 自由 度 | 1| 
第 2 自由 度 12 


F 
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9. F 分 布 的 概率 





选择 “B4” 单 元 格 。 











A 
IE | 55. 6) 
BETI | 十 
3 | 第 2 自由 度 12 
iw E 


选择 菜单 栏 中 的 “插入 ” 栏 内 的 “函数 "。 


在 “选择 类 别 ” 中 选择 “统计 "， 在 “选择 函数 ”中 选择 “FDIST"。 


选择 “B1”、“B2” 和 “B3” 单 元 格 ， 点 击 “确定 "。 
下 ER J CC | 0 | z | 了 











ar |__ 5B. 6] | | 
2 | 第 1 自由 度 | 1 | | 

3 | 第 2 自由 度 | 12 | 

男 | 

prs 

as 

pri 

a 

pe 

ao} 

az}, 

13] 

JE | Metronet Sanam Aa 1 i0510 2m, Re 10 
| ede 2 
ay AER = TB6TTSE-0 

到 mene Ce Cea 
on 7 
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计算 完毕 ! 








“7.67E-06” 是 Excel 中 的 书写 格式 ， 实 际 上 是 “7.67x 10°", 


10. (E) MAAND A) 回归 系数 
所 用 数据 见 第 107 DO EEEE CEY EASO CAR) ERR” 表单 中 。 
ED 


选择 “G2” 单 元 格 。 


























x mC DELE an 
高 i 
| 最 最 ~ 
HE 近 8 | 第 
面 | 车 žin * 
积 | 站 站 | 积 | 项 
| “| 的 的 | ~- 
El E| 
1 | 高 | 


| | 次 
ZEBE 10 80469 MBRR C | 




















了 | 寺 井 站 大 大 店 | 8 0 366 | li 
和 | 曾 根 店 | .8l200 371, | | 
5 | 桥 本 大 街 店 51200| 208 i | i 
Le [mma 7/800) 246 | | poe 
了 | 邮政局 前 店 8/280 297 [ae 
(8 KMITANIE ， 7，40| 3 | i li | 
9 | 六 条 站 大 厦 店 | 9 0 436) | | i 
10 | 若 叶 川 店 | .6330 198 | i | 


美里 店 | 91180 364) | 





选择 菜单 栏 中 的 “插入 ” 栏 内 的 “函数 "。 


在 “选择 类 别 ”中 , 选择 “统计 "， 在 “选择 函数 ”中 , 选择 “LINEST"。 
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选择 下 图 所 示 的 范围 点击“ 确定 ”"。“Const” 和 “Stats” 中 无 需 输入 任何 值 。 





A a Se eee eae ce o o L 
E E 
离 高 
最 最 一 
上 店 近 | 月 近 | 目 % 
铺 © 铺 
面 村 rig 
站 站 项 
积 额 积 
的 的 - 
Æ E 
1 a 高 ， 








以 “G2” 单 元 格 为 起 点 ， 按 照 下 图 选择 从 “G2” 到 “12” 


这 
下 
高 
最 A 
TAT 
ei 
站 fom 
的 Z 
E 
“x 
amano sa) 
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点 击 数学 公式 栏 中 的 这 一 部 分 。 
WO MAD BLO IAD 数据 






=LINEST (D2:D11, B2:C11) 


一 起 按 下 “Shift” 键 和 “Ctrl” 键 ， 同 时 再 按 “Enter” 键 


计算 完毕 ! 
EEE 
E 
x 
最 a 
a |S |e 
g ia 
站 项 
m | Rie 
距 
次 
Er | 


在 “LINEST” 函 数 中 ， 是 按照 顺序 求解 ( 偏 ) 回归 系数 的 。 从 左 到 右 分 别 
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= SSS 


T1. Logistic HAA EAGER 


AE, FE Excel 中 ， 并 没有 可 以 直接 用 于 求解 Logistic 回归 方程 的 回归 系数 函 
数 。 因 此 ， 本 节 将 介绍 如 何 使 用 Excel 中 的 “Solver” 功 能 来 求解 回归 系数 。 


Solver 





@ 选择 菜单 栏 中 的 “工具 ” 栏 内 的 “加 载 安 "。 
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图 如 果 出 现 “需要 Excel 的 安装 光盘 ”等 信息 ， 那 么 请 按 指示 操作 。 

按照 以 上 步骤 操作 以 后 ， 我 们 便 可 以 使 用 这 一 功能 了 。 

我 们 可 以 将 第 162 页 的 数据 输入 Excel 表格 。 如 果 读 者 朋友 想 要 求解 本 节 示例 
以 外 的 Logistic 回归 方程 的 回归 函数 ， 那 就 要 根据 实际 情况 输入 相应 的 Excel 函数 。 



























































选择 “L3” 单 元 格 
-A 
伦 似 
a| je ® 
ti 供 a 
Sal] 到 | | me 
周 高 
sa n a 的 
的 值 计 
或 度 
atm p 
日 * 过 
情 a 
1 网 = 
2 5 日 星期 一 | 0 .28 1| |0.50 | [0.50 m 
6 日 星期 二 | o 24 of |0.50 | |o.50 
aha mz | az ol oso] Joo 
sjea mam] o 2 of |o:so | foso] [a 
[s98 “星期 五 | 0 23 of [0.60 | |o.so | faz 
多:o6 mmx | 1 2 1| |0.50 | Jo. 60] b 
s116 MME | 1 24 of |0.50 | [0.50 
3120 “星期 一 0 6 4| |, 50 | |0. 50 | | 因 亮 县 的 人 是 [1] 的 个 体 个 邹 8j 
10/138 RM= o 25, 0} 10.60 | [0.50 | | 因 蛮 量 的 值 是 [0] 的 个 体 个 至 13) 
[ul14 日 ”星期 三 | 2s! Jo. 50 | Jo. 50 系数 -0. 04307] 
malisa maT o n al loso T la so 
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选择 菜单 栏 中 的 “工具 ” 栏 内 的 “规划 求解 ”。 








按照 下 图 进行 设置 ， 然 后 点 击 “ 求 解 ”。 














ae s eID er a 二 TI 
伦 似 
m| | R 
E 供 函 
mw eR] | 项 | | x 
aa | 测 | | 的 
K : 
或 度 | 的 值 计 
销 算 
周 
B 售 过 
情 程 
况 z 

















e 
a 
S 


| NEMS N 


e= lolo =l [10 mlolo 
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点 击 “ 确 定 ”。 





OR 
 ORE@ J 


CEO C Geo) Cem) 















































计算 完毕 ! 
hae Wa Bas ciola ee m r ta TR ae. 
fe 似 
M ja R 
Jig & m 
Saal] ml] x 
MON all 测 | | 的 
sol] ao | | 计 
RE ay x 
周 i 
日 | |* 过 
| 情 程 
1 况 < 
L259 星期 一 | 0 28) 1) |0.50 | |0.50 | Mimes 4, 178-01| 
sjea 星期 二 | 0 24 of Jo.50 | |o. 50 | lamens -14. 5561| 
sa 星期 三 | 1 26 ol |0,50 | fo. 50 
8 日 “星期 四 | o 24 of [0.50 | |o.s0 | fa 
9 日 BME! o 23 of 10.50 | 0.50] faz 
108 星期 六 1 28) 1 10.50 | [0.50 lb 
el1 日 ”星期 日 | 1 24 of |o.50 | Jo.50 
各 |12 日 ”星期 二 | o 26 3] |0. 50 | Jo. 50 | fom mime ae 
-地 |13 日 “星期 三 | o 25 of |0.50 | |0.50 | | 因 变 量 的 值 是 [o] 的 个 体 个 13 
uja  M= | 1 28 a] 0.50 | Jo. 50 | aras 0.04507 
32 上 15 日 “星期 四 | o 2 o fo. s0 | |o.so 
在 第 109 页 中 我 们 讲 过 ,用 最 小 二 乘法 求解 重 回归 方程 的 偏 回归 系数 。 在 " 数 


据 - 回 归 .xls” 中 ,为 了 练习 使 用 Solver 功能 来 求解 第 3 章 例题 中 的 偏 回归 系数 ， 


我 们 还 准备 了 “ 重 回归 方程 solvr" 这 样 一 张 工作 表 。 为 了 进一步 熟悉 Solver 功能 ， 
同时 也 为 了 体会 最 小 二 乘法 的 思想 ， 请 您 务必 要 接受 这 一 挑战 。 
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( N-0355.0101 ) 

责任 编辑 : BB 赵 丽 艳 
责任 制作 : BU 魏 说 
封面 制作 : BS va 


用 漫画 这 种 形式 讲 数学 、 物 理 和 统计 学 ， 十 分 有 利于 在 广大 青少年 中 普及 科学 知识 。 


周 思 来 、 邓 着 奶 秘 书 ， 周 因 来 对 疾 超 纪念 馆 顾问 Pd 
PARERE, KRKA) 顾问 ， 全 国政 协 原 副 秘 书 长 


用 漫画 和 说 故事 的 形式 讲 数学 ， 使 面貌 冷峻 的 数学 变 得 亲切 、 生 动 、 有 趣 ， 使 学 习 数学 变 得 容 
易 ， 这 对 于 提高 全 民 的 数学 水 平 无 疑 是 功德 无 量 的 事 。 


《数理 天 地 杂志 社 社 长 总 编 
" 硕 望 杯 ”全 国教 学 邀请赛 组 委 会 命题 委员 会 主任 周 国 t 


用 漫画 的 形式 ， 讲 解 日 常生 活 中 的 数学 、 物 理 知识 ， 更 能 让 大 家 感受 到 数学 殿堂 的 奥妙 与 乐趣 。 


《光明 日 报 》 原 副 总 编辑 这 
+ 
中 华 炎黄 文化 研究 会 常务 别 会 长 # d 


科学 漫画 是 帮助 学 习 文 科 的 人 们 用 形象 思维 的 方式 掌握 自然 科学 的 金 钥匙 。 


中 国人 民 大 学 外 语 学 院 日 语 专业 主任 、， + 
大 学 日语 才 学 研究 全 sr BY AL 


在 日 术 凡 学 的 时 候 ， 都 能 看 到 很 多 年 经 的 白领 掉 这 大 图书， 经济 实惠 、 图 广 
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